这个截屏项目火了！给它一张屏幕截图，即可一键克隆网页！-HQY 一个和谐有爱的空间

这个截屏项目火了！给它一张屏幕截图，即可一键克隆网页！

本文为大家分享一款本周爆火的 GPT开源项目。

你敢信，只凭借着一张屏幕截图即可转换生成 HTML/Tailwind CSS 代码。可以算得上是前端工程师的福音。它就是 screenshot-to-code。

而这个项目刚上线也就一周左右，在GitHub上就已经有 17.3k 的Star。它可以纳入本周爆火项目之一了！

screenshot-to-code 的功能实现是借助 gpt-4-vision-preview 模型，直接给你的屏幕截图转换为 HTML/Tailwind CSS，并利用 DALL-E 3 的图像生成能力，生成外观相似的图像。

说的通俗易懂一点就是，该项目利用 GPT4 Vision 的能力来完成图像识别和代码生成的功能。

该项目是采用前后端分离模式，后端是采用 Python FastAPI 框架 开发而成。前端则是借助 React 框架构建。

利用这个开源工具，我们可以直接将设计稿转换为实际代码，快速为网站生成 Demo。也可以在学习过程中，用该工具来模仿学习其它网站代码。

与其说是前端的福音，不如说是后端的福音，是不太擅长前端代码编程人的福音。

• GPT-4Vision智能生成代码: 通过集成GPT-4Vision，该应用程序能够智能地分析截图并生成相应的HTML、Tailwind CSS和JavaScript代码，使用户无需手动编写代码。
• DALL-E3生成相似图像: 应用程序不仅生成代码，还利用DALL-E3生成与原始截图相似的图像，增强用户体验。
• 实时代码更新: 用户可以直接在应用程序中查看生成的代码，并在需要时通过与AI的互动指令，调整样式或更新缺失的部分，以满足其需求。
• 灵活的配置选项: 应用程序提供了设置，允许用户选择是否启用DALL-E图像生成功能，使其更加灵活适应不同需求。
• 本地部署与用户反馈: 用户可以通过本地部署应用程序进行使用，同时FAQ部分提供了解决常见问题的指南。用户还可以通过GitHub上的issue或Twitter提供反馈、功能请求和报告bug。

前提：需要一个能够访问 GPT-4 Vision API 的 OpenAI API 密钥。

后端Python需要安装一个poetry模块来进行包管理。

pip install poetry

然后以此命令来运行：

cd backend
echo "OPENAI_API_KEY=sk-your-key" > .env
poetry install
poetry shell
poetry run uvicorn main:app --reload --port 7001

运行前端：

cd frontend
yarn
yarn dev

前端和后端都运行后，访问指定服务http://localhost:5173即可使用。

有大佬们看到该项目爆火后，就去研究了下它的实现原理，其核心竟然是依靠 Prompt，然后通过 Prompt提示词去交给gpt4-vision模型去处理。

以下内容为英译中后的Prompt：

你是一名熟练的Tailwind开发者你从用户那里获取参考网页的截图，然后使用Tailwind、HTML和JS构建单页面应用程序。你可能也会收到你已经构建的网页的截图，并要求更新它的外观，使其更像参考图片。

在库方面:

• 使用这个脚本来包含Tailwind：
• 你可以使用Google Fonts
• Font Awesome用于图标：<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.15.3/css/all.min.css"></link>

仅返回在<html></html>标签中的完整代码。不要包括markdown "```" 或在开头或结尾的 "```html".

生成图片的原理，是直接从生成好的 HTML 中提取出 img 标签，再次调用 DALL-E 3 接口生成图片，替换进去。