排序
Puppeteer国产镜像地址不能用了?
先说背景。 组里同学反馈说GitLab流水线里有时候会失败,我看了下错误,安装Puppeteer失败了。我们知道,Puppeteer依赖于Chrome内核,所以会下载一个无头浏览器,这个是比较耗时的,而且它的资...
Deno使用Puppeteer开发实践
在当今的数字时代,Web自动化和数据采集已经成为许多企业和个人项目的重要组成部分。为了实现这些任务,需要一个强大而灵活的工具,能够模拟用户行为,自动执行各种网页操作,并提取所需的数据...
? Puppeteer 实战教程 – 爬取 Github 高星项目数据
Puppeteer 是 Google 开源的一个用于操作浏览器的库,可以用于爬虫、自动化测试等。Puppeteer 的本义是“提线木偶”,因此可以把它理解为代替我们去操作浏览器的一个机器人,例如我想收集 Githu...
HTML页面导出为PDF完整指南(实现篇)
项目背景 笔者所在团队开发了一个智能报告系统,其提供客户服务概况、智能问答(借助ChatGPT)等能力。其中存在导出报告的场景,需要重新实现。通过前期调研,最终确定了以无头浏览器模拟访问报...
一次 serverless + puppeteer 的实践与填坑
从生成PDF需求引起的问题 因为项目中涉及到了 PDF 文件的生成,目前生成 PDF 使用的纯前端 html2canvas + jspdf的方案,这种方案虽然不需要服务端的支持,但用户体验也大打折扣,最终权衡以下弊...