├── .DS_Store ├── LICENSE ├── README.md ├── assets └── img │ └── weixin.png └── docs ├── .DS_Store ├── 2024-12-02 ├── .DS_Store ├── 2024-12-03-11-03-19.png ├── Depth.png ├── image-1.png ├── image-10.png ├── image-11.png ├── image-2.png ├── image-3.png ├── image-4.png ├── image-5.png ├── image-6.png ├── image-7.png ├── image-8.png ├── image-9.png ├── image.png └── index.md ├── 2024-12-09 ├── 2024-12-09-11-59-09.png ├── 2024-12-09-11-59-59.png ├── 2024-12-09-12-15-14.png ├── 2024-12-09-12-30-29.png ├── 2024-12-09-12-49-16.png ├── 2024-12-09-13-18-29.png ├── hailuo.webp ├── image-1.png ├── image-2.png ├── image-3.png ├── image-4.png ├── image-5.png ├── image.png └── index.md ├── 2024-12-16 ├── image-1.png ├── image-10.png ├── image-11.png ├── image-12.png ├── image-13.png ├── image-2.png ├── image-3.png ├── image-4.png ├── image-5.png ├── image-6.png ├── image-7.png ├── image-8.png ├── image-9.png ├── image.png └── index.md ├── 2024-12-23 ├── 2024-12-23-10-46-54.png ├── image-1.png ├── image-10.png ├── image-11.png ├── image-2.png ├── image-3.png ├── image-4.png ├── image-5.png ├── image-6.png ├── image-7.png ├── image-8.png ├── image-9.png ├── image.png └── index.md ├── 2025-01-13 ├── image-1.png ├── image-10.png ├── image-11.png ├── image-2.png ├── image-3.png ├── image-4.png ├── image-5.png ├── image-6.png ├── image-7.png ├── image-8.png ├── image-9.png ├── image.png └── index.md ├── 2025-01-20 ├── image-1.png ├── image-2.png ├── image-3.png ├── image-4.png ├── image-5.png ├── image-6.png ├── image-7.png ├── image.png └── index.md ├── 2025-01-6 ├── image-1.png ├── image-2.png ├── image-3.png ├── image-4.png ├── image-5.png ├── image-6.png ├── image-7.png ├── image-8.png ├── image.png └── index.md └── 2025-02-24 ├── image-1.png ├── image-2.png ├── image-3.png ├── image-4.png ├── image-5.png ├── image-6.png ├── image-7.png ├── image-8.png ├── image.png └── index.md /.DS_Store: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/.DS_Store -------------------------------------------------------------------------------- /LICENSE: -------------------------------------------------------------------------------- 1 | MIT License 2 | 3 | Copyright (c) 2024 Xiaoqian Zhang 4 | 5 | Permission is hereby granted, free of charge, to any person obtaining a copy 6 | of this software and associated documentation files (the "Software"), to deal 7 | in the Software without restriction, including without limitation the rights 8 | to use, copy, modify, merge, publish, distribute, sublicense, and/or sell 9 | copies of the Software, and to permit persons to whom the Software is 10 | furnished to do so, subject to the following conditions: 11 | 12 | The above copyright notice and this permission notice shall be included in all 13 | copies or substantial portions of the Software. 14 | 15 | THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR 16 | IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, 17 | FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE 18 | AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER 19 | LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, 20 | OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE 21 | SOFTWARE. 22 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 |

欢迎来到开源AIGC 周刊 👋

2 | 3 | ## 简介 4 | 5 | 开源 AIGC 周刊,为你挑选最值得分享的开源 AIGC 项目。 6 | 7 | **每周一**以周刊的形式更新发布。内容包括:**高赞开源AIGC项目**、**最新 AI 资讯**、**AIGC 变现实战**、**AI 教程**等。 8 | 9 | 希望帮助所有读者学习 AIGC,并增长职业和副业的收入。 10 | 11 | ## 内容 12 | 获得更好的阅读体验 [公众号](/assets/img/weixin.png) 13 | 14 | [第 1 期](/docs/2024-12-02/index.md) 15 | [第 2 期](/docs/2024-12-09/index.md) 16 | [第 3 期](/docs/2024-12-23/index.md) 17 | [第 4 期](/docs/2024-12-16/index.md) 18 | [第 5 期](/docs/2025-01-06/index.md) 19 | [第 6 期](/docs/2025-01-13/index.md) 20 | [第 7 期](/docs/2025-01-20/index.md) 21 | [第 8 期](/docs/2025-02-24/index.md) 22 | ## 声明 23 | 知识共享许可协议
本作品采用 署名-非商业性使用-禁止演绎 4.0 国际 进行许可。 24 | -------------------------------------------------------------------------------- /assets/img/weixin.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/assets/img/weixin.png -------------------------------------------------------------------------------- /docs/.DS_Store: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/.DS_Store -------------------------------------------------------------------------------- /docs/2024-12-02/.DS_Store: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/.DS_Store -------------------------------------------------------------------------------- /docs/2024-12-02/2024-12-03-11-03-19.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/2024-12-03-11-03-19.png -------------------------------------------------------------------------------- /docs/2024-12-02/Depth.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/Depth.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-1.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-10.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-10.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-11.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-11.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-2.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-3.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-3.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-4.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-4.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-5.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-5.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-6.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-6.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-7.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-7.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-8.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-8.png -------------------------------------------------------------------------------- /docs/2024-12-02/image-9.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image-9.png -------------------------------------------------------------------------------- /docs/2024-12-02/image.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-02/image.png -------------------------------------------------------------------------------- /docs/2024-12-02/index.md: -------------------------------------------------------------------------------- 1 | --- 2 | title: '开源 AIGC 周刊 #1' 3 | pubDate: 2024-12-02 4 | author: '张XX' 5 | --- 6 | 7 | 每周精选最具潜力的 AI 开源工具与技术。我们为你解析项目亮点与应用场景,并推荐实用资源,帮助你在 AI 开发中领先一步!无论是学习还是实践,《开源 AIGC 周刊》都是你的每周灵感来源! 8 | 9 | ## 本周不可错过的 AI 开源项目 10 | 11 | ### [Lobe Chat 🌟45.6k](https://github.com/lobehub/lobe-chat) 12 | 13 | 14 | 开源的人工智能聊天框架, 支持**多种人工智能模型**、**知识库**、**多种模式**(视觉/TTS/插件/人工智能)。 不仅如此,它还支持**PWA, 自定义主题**等特性,非常适合一键式免费部署私有 ChatGPT/ Claude 应用程序。 15 | 16 | Lobe Chat 17 | 18 | ### [VideoLingo 🌟7.5k](https://github.com/Huanshere/VideoLingo) 19 | 全自动视频搬运 AI 字幕组,支持字幕切割、翻译、对齐和添加配音。有搬运海外热门视频需求的话可以试试。 20 | 21 | [demo](https://github.com/user-attachments/assets/25264b5b-6931-4d39-948c-5a1e4ce42fa7) 22 | 23 | 24 | ### [FlipSketch 🌟195](https://github.com/hmrishavbandy/FlipSketch) 25 | 将静态绘图翻转为文本引导的草图动画, 目前出图的效果不是很稳定,但创意不错,有兴趣的话可以翻看下源码。 26 | 27 | 28 | 29 | ### [MinerU 🌟 19.9k](https://github.com/opendatalab/MinerU/blob/master/README_zh-CN.md) 30 | MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 31 | 32 | [demo](https://github.com/user-attachments/assets/4bea02c9-6d54-4cd6-97ed-dff14340982c) 33 | 34 | ### [Fooocus 🌟41.8k](https://github.com/lllyasviel/Fooocus) 35 | Fooocus 是一款离线、开源和免费的 AI 图像生成软件(基于 Gradio),完全基于 Stable Diffusion XL 架构。与 Midjourney 类似,用户只需关注提示和图像。 36 | 37 | 38 | 39 | 40 | 41 | ### [SANA 🌟1.2k](https://github.com/NVlabs/Sana) 42 | 英伟达开源的文生图模型,优势是生图速度快,能够生成 4k 图片,特别适用于端侧设备。0.6B模型在生成 1024 * 1024 分辨率图片时,仅需 0.9s, 是flux-dev 的 39.5倍。 43 | 44 | 45 | 46 | 47 | ## 最新行业动态 48 | ### 1. [阿里通义开源最强国产推理模型](https://huggingface.co/Qwen/QwQ-32B-Preview)。 49 | 50 | QwQ-32B-Preview 是阿里最新开源的推理模型,目前尚在预览阶段,其推理能力非常出众,尤其是数学推理性能上超越了 o1-preview。 51 | 52 | ### 2. [ComfyUI 桌面测试版发布](https://blog.comfy.org/open-sourcing-v1-desktop/)。 53 | 54 | comfyUI 目前已经开放了测试版的下载地址,支持 Window 和 Mac 平台的安装。目前开源了 V1 beta 版的代码。 55 | 56 | ### 3. [Generative Omnimatte:视频分层](https://gen-omnimatte.github.io/) 57 | 58 | 谷歌推出的视频分层工具,可以将视频分解成一组 RGBA 全色图层,其中每个图层由一个完全可见的物体及其相关效果(如阴影和反射)组成。可以针对每个图层进行编辑,例如去掉物体、更换视频背景等。目前尚未开源。 59 | 60 | [demo](https://gen-omnimatte.github.io/assets/videos/layers/lego_animation_pause-occlusion.mp4) 61 | 62 | 63 | ### 4. [Stable Diffusion 3.5 新增 controlNet](https://stability.ai/news/sd3-5-large-controlnets) 64 | 65 | Stability AI 发布了新版 Stable Diffusion3.5Large,新增三种 ControlNet 功能,分别是Blur、Canny和Depth,显著提升了图像生成能力。用户可在不商业化的前提下免费使用该模型。 66 | 67 | 68 | 69 | 70 | ## 本周 AI 教程/实战 71 | 1.[如何使用 Midjourney](https://learningprompt.wiki/docs/midjourney/mj-tutorial-basics/how-to-use-midjourney) 72 | 73 | 2.[如何使用 AI 备考雅思](https://learningprompt.wiki/docs/ai-101/best-practice/learning/learning-IELTS) 74 | 75 | 76 | ## 本周 AI 变现思路分享 77 | **用 AI 制作小红书 “套路” 视频,通过低成本日更方式持续吸粉,万粉后通过广告、开设店铺或联盟推广的方式变现**。 78 | 79 | ### 实战分析 80 | 81 | **小红书博主**: 【Salvo 英语阅读】 | 8.8W 粉丝 | 仅橱窗变现 2w+💰 82 | 83 | **内容**:AI 英语跟读。通过实用的英文短文 + 美观的配图 + 口语朗读,引发读者的兴趣和关注,后续可开店推英语学习相关产品来实现变现。 84 | 85 | 86 | 87 | **AI 工具**:GPT + Midjourney + TTS 88 | - GPT: 寻找爆款短文特点,投喂给 GPT 生成英文短文文本。 89 | - Midjourney: 生成配图 90 | - TTS: 生成英文朗读配音 91 | 92 | **案例点评**: 93 | 英语学习类别在小红书上受众很广,易于吸引大量粉丝关注。同时,精心选择的配图也能够直观的提升视频的吸引力。在变现方面,该账号具有较高的商业潜力,包括接商单,带货等。 94 | 95 | 96 | 97 | ## 关于周刊 98 | 99 | 开源 AIGC 周刊,为你挑选最值得分享的文章、教程、开源项目、副业变现等内容。希望帮助所有读者学习 AIGC,并增长职业和副业的收入。 100 | 101 | 周刊在 Github [开源](https://github.com/YOYZHANG/open-source-ai-weekly),可以通过 issue [投稿](https://github.com/YOYZHANG/open-source-ai-weekly/issues/new)。 102 | -------------------------------------------------------------------------------- /docs/2024-12-09/2024-12-09-11-59-09.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/2024-12-09-11-59-09.png -------------------------------------------------------------------------------- /docs/2024-12-09/2024-12-09-11-59-59.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/2024-12-09-11-59-59.png -------------------------------------------------------------------------------- /docs/2024-12-09/2024-12-09-12-15-14.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/2024-12-09-12-15-14.png -------------------------------------------------------------------------------- /docs/2024-12-09/2024-12-09-12-30-29.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/2024-12-09-12-30-29.png -------------------------------------------------------------------------------- /docs/2024-12-09/2024-12-09-12-49-16.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/2024-12-09-12-49-16.png -------------------------------------------------------------------------------- /docs/2024-12-09/2024-12-09-13-18-29.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/2024-12-09-13-18-29.png -------------------------------------------------------------------------------- /docs/2024-12-09/hailuo.webp: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/hailuo.webp -------------------------------------------------------------------------------- /docs/2024-12-09/image-1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/image-1.png -------------------------------------------------------------------------------- /docs/2024-12-09/image-2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/image-2.png -------------------------------------------------------------------------------- /docs/2024-12-09/image-3.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/image-3.png -------------------------------------------------------------------------------- /docs/2024-12-09/image-4.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/image-4.png -------------------------------------------------------------------------------- /docs/2024-12-09/image-5.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/image-5.png -------------------------------------------------------------------------------- /docs/2024-12-09/image.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-09/image.png -------------------------------------------------------------------------------- /docs/2024-12-09/index.md: -------------------------------------------------------------------------------- 1 | --- 2 | title: '开源 AIGC 周刊 #2' 3 | pubDate: 2024-12-09 4 | author: '张XX' 5 | --- 6 | 7 | 每周精选最具潜力的 AI 开源工具与技术。我们为你解析项目亮点与应用场景,并推荐实用资源,帮助你在 AI 开发中领先一步!无论是学习还是实践,《开源 AIGC 周刊》都是你的每周灵感来源! 8 | 9 | ## 本周不可错过的 AI 开源项目 10 | 11 | ### [腾讯混元视频模型 🌟4.7k](https://github.com/Tencent/HunyuanVideo) 12 | 腾讯开源了混元视频模型,它在视频生成方面的性能可与领先的闭源模型相媲美,甚至更胜一筹。 它拥有超过 130 亿个参数, 是所有开源模型中最大的模型。 根据专业的人工评估结果,混元视频的性能优于之前的最先进模型,包括 Runway Gen-3、Luma 1.6 和 3 个性能最好的中文视频生成模型。 13 | 14 | 15 | 16 | 17 | ### [Fish Speech 1.5 🌟16.2k](https://huggingface.co/spaces/fishaudio/fish-speech-1) 18 | Fish Speech 1.5 是由 Fish Audio 研发的基于 VQ-GAN 和 Llama 的多语种语音合成模型。这是一项在 TTS-Arena 排名第二的开源语音合成技术,支持 13 种语言,并提供 150 毫秒以内的低延迟高质量即时语音克隆。 19 | 20 | 21 | 22 | ### [MEMO 🌟193](https://github.com/lobehub/lobe-chat) 23 | 开源的数字人头项目,能够根据音频生成人物肖像的视频。MEMO 可生成更逼真的谈话视频,涵盖不同的图像和音频类型,在整体质量、音频-唇部同步、身份一致性和表情-情绪一致性方面均优于最先进的方法。 24 | 25 | 26 | 27 | ### [GenCast 🌟5.2k](https://github.com/hmrishavbandy/FlipSketch) 28 | GenCast 是谷歌开源的一款天气预报模型,专门用于预测天气和极端天气事件。该模型提供更快、更准确的预报,最远可达 15 天。 29 | 30 | 31 | 32 | ### [TRELLIS 🌟 1.9k](https://github.com/Microsoft/TRELLIS) 33 | TRELLIS 是微软开源的一款图片生成3D模型,是提供了多达 20 亿个参数的大规模预训练模型。 TRELLIS 大大超越了现有的3D模型,并展示了灵活的输出格式选择和本地三维编辑功能,这是以前的模型所不具备的。 34 | 35 | 36 | 37 | 38 | ### [ClearerVoice-Studio 🌟661](https://github.com/modelscope/ClearerVoice-Studio) 39 | ClearerVoice-Studio 是由阿里通义团队开源的人工智能语音处理工具包,支持语音增强、语音分离、目标扬声器提取等功能,且是可商用的协议。 40 | 41 | 42 | ## 最新行业动态 43 | 44 | ### 1. [OpenAI 12Days Day1: OpenAI o1正式版发布](https://openai.com/12-days/)。 45 | 46 | ![](2024-12-09-13-18-29.png) 47 | 12月5日是 OpenAI Day1, 主要内容包括: 48 | - 完整版 o1(暂无 API 支持) 49 | - o1 pro 模型 50 | - 每月 200 美元(约合 1450 人民币)的 ChatGPT Pro 订阅服务 51 | 52 | ChatGPT Pro权益是提供了无限制访问高级语音模式、o1、4o 以及全新的 o1 pro 模型的特权,一般人应该用不上。 53 | 54 | ### 2. [Hailuo I2V-01-Live](https://github.com/ltdrdata/ComfyUI-Impact-Pack/issues/843) 55 | 56 | 海螺 I2V-01-Live 是 I2V 系列的最新成员,它专门针对动漫图片,让角色以前所未有的方式移动、说话。 57 | 58 | 59 | 60 | 61 | 可以在 Creation Box 中创建自己的 I2V-01-Live 动画: 62 | 63 | 64 | ### 5. [谷歌 Genie 2:AI 生成无尽可操作的游戏世界](https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/) 65 | 66 | Genie 2 是由谷歌开发的大型世界模型,基于单张图片即可生成无尽的可操作和交互式 3D 游戏世界。用户可以通过键盘和鼠标控制这些生成的世界,主要用于训练或评估 AI agent。 67 | 68 | 69 | 70 | ### 6. [警惕:ComfyUI热门插件Impact-Pack被植入病毒](https://github.com/ltdrdata/ComfyUI-Impact-Pack/issues/843) 71 | 72 | 73 | 74 | ComfyUI-Impact-Pack 插件依赖的 ultralytics 包被恶意植入了挖矿病毒,这几乎是一个必装的插件。如果你正在使用,请务必立即卸载。或可以直接通过 GitHub 安装 ultralytics 这个依赖,或者使用 8.3.43 版本,具体可以查看 [843](https://github.com/ltdrdata/ComfyUI-Impact-Pack/issues/843)。 75 | 76 | ### 7. [Meta发布 LLaMA 3.3 70B](https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct)。 77 | 78 | Meta 正式发布了Llama 3.3 70B,这款模型支持 128K 的上下文窗口,具备多语言能力,并且增强了工具调用功能。 79 | 与 Llama 3.1 70B 相比,其性能有了显著提升,部分基准测试结果甚至可与 Llama 405B 媲美。 80 | 81 | ## 关于周刊 82 | 83 | 开源 AIGC 周刊,为你挑选最值得分享的文章、教程、开源项目、副业变现等内容。希望帮助所有读者学习 AIGC,并增长职业和副业的收入。 84 | 85 | 周刊在 Github [开源](https://github.com/YOYZHANG/open-source-ai-weekly),可以通过 issue [投稿](https://github.com/YOYZHANG/open-source-ai-weekly/issues/new)。 86 | -------------------------------------------------------------------------------- /docs/2024-12-16/image-1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-1.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-10.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-10.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-11.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-11.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-12.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-12.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-13.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-13.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-2.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-3.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-3.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-4.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-4.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-5.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-5.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-6.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-6.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-7.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-7.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-8.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-8.png -------------------------------------------------------------------------------- /docs/2024-12-16/image-9.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image-9.png -------------------------------------------------------------------------------- /docs/2024-12-16/image.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-16/image.png -------------------------------------------------------------------------------- /docs/2024-12-16/index.md: -------------------------------------------------------------------------------- 1 | --- 2 | title: '开源 AIGC 周刊 #3' 3 | pubDate: 2024-12-09 4 | author: '张XX' 5 | --- 6 | 7 | 每周精选最具潜力的 AI 开源工具与技术。我们为你解析项目亮点与应用场景,并推荐实用资源,帮助你在 AI 开发中领先一步!无论是学习还是实践,《开源 AIGC 周刊》都是你的每周灵感来源! 8 | 9 | ## 本周不可错过的 AI 开源项目 10 | 11 | 12 | 13 | ### [screenshot-to-code 🌟65.4k](https://github.com/abi/screenshot-to-code) 14 | 一款使用 AI 将屏幕截图、模型和 Figma 设计转换为简洁实用的代码的简单工具。现在支持 Claude Sonnet 3.5 和 GPT-4o。还可拍摄网站运行时的视频/屏幕录像,并将其转化为功能原型。 15 | 16 | 17 | 18 | ### [OneDiffusion:功能强大的生图模型 🌟 476](https://github.com/lehduong/OneDiffusion?tab=readme-ov-file) 19 | 20 | OneDiffusion 是一个多功能生图模型,功能非常强大,目前支持文生图、ID 一致性、单图生多视角、文生多视角、根据主题生成等多种功能。 21 | 22 | 23 | ### [RAGFlow 🌟 25.3k](https://github.com/infiniflow/ragflow) 24 | RAGFlow 是一款基于深度文档理解构建的开源 RAG 引擎。它可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。 25 | 26 | 27 | 28 | ### [PDFMathTranslate 🌟4.2k](https://github.com/Byaidu/PDFMathTranslate/tree/main) 29 | PDFMathTranslate 能够将PDF文档进行双语翻译,并完整保留排版。支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker。 30 | 31 | 32 | 33 | ### [HivisionIDPhotos 🌟 1.4k](https://github.com/Zeyi-Lin/HivisionIDPhotos) 34 | HivisionIDPhoto 是一个轻量级的AI证件照制作算法,完全开源免费,利用一套完善的AI模型工作流程,来实现对多种用户拍照场景的识别、抠图与证件照生成。 35 | 36 | 37 | 38 | ### [metamotivo 🌟 278](https://github.com/facebookresearch/metamotivo) 39 | Meta Motivo 是首个人体动作生成模型,能够控制并生成符合物理规律的人体动作,还蛮有意思的。 40 | 41 | 42 | ## 最新行业动态 43 | ### 1. [OpenAI 12Days Day3-6](https://openai.com/12-days/) 44 | OpenAI Day3: 45 | - Sora正式发布, 它是一款文生视频生成模型。现在已经可以通过 http://sora.com 来登录访问。 46 | - ChatGPT Plus用户(20美元/月),每月最多生成50个视频,5秒720P分辨率,有水印。 47 | - ChatGPT Pro用户(200美元/月),每月最多优先生成500个视频,1080P最多10秒,720P可以生成20秒,无水印。 48 | 49 | OpenAI Day4: 50 | - 推出了全新的 ChatGPT Canvas。新 Canvas 支持与 ChatGPT 实时协作编程、写作。 51 | 52 | OpenAI Day6: 53 | - 推出了高级语音模式,并新增了 Vison 能力。用户可以将相机或屏幕的实时内容分享给 ChatGPT。 54 | 55 | 56 | ### 2. [谷歌 Willow:量子芯片的划时代突破](https://blog.google/technology/research/google-willow-quantum-chip/) 57 | 58 | 59 | 60 | Google 推出的 Willow 是一款划时代的量子芯片,它在量子错误校正方面取得了重大突破,Willow 能够在不到五分钟的时间内完成一项基准计算,而这需要当今最快的超级计算机需花费 10^25年的时间。同时Willow 通过提升量子位的数量,可以成倍降低计算的错误率。 61 | 62 | 官方博客:https://blog.google/technology/research/google-willow-quantum-chip/ 63 | 64 | 谷歌出的量子计算免费课程:https://coursera.org/learn/quantum-error-correction 65 | 66 | 67 | ### 3. [谷歌发布 Gemini2.0 Flash Experimental](https://developers.googleblog.com/en/the-next-chapter-of-the-gemini-era-for-developers/) 68 | 69 | Gemini Flash 2.0 堪称最强大模型,它的速度是 1.5 Pro 的两倍,这款新一代AI模型在多模态功能上进行了显著改进,可用于构建具有实时音频和视频流的动态应用程序。 70 | 71 | 72 | 73 | 74 | ### 4. [Grok 向所有用户免费开放](https://x.ai/blog/grok-1212) 75 | 76 | Grok 对所有用户免费,包含新推出 Grok2版本。Grok2不仅支持实时搜索,还支持绘图,分析帖子等,不愧是马斯克送出的圣诞大礼。 77 | 78 | 79 | ### 5. [PIKA AI 发布 Pika 2.0](https://pika.art/login) 80 | 81 | PIKA AI 发布Pika 2.0 模型。模型支持上传商品或衣服照片可以实现试穿试用,上传两个人的照片可以轻松实现合影等。看效果确实不错,非常适合生成广告片,宣传视频等。 82 | 83 | 84 | 85 | 86 | ### 6. OpenAI 服务大规模宕机超 4 小时 87 | 12月10日,OpenAI 遭遇了大规模宕机,包括 API、网站、Sora 和 Playground 在内的服务均无法使用,宕机时间超过 4 小时。截至目前,所有服务已完全恢复。 88 | 89 | 90 | ## 本周 AI 教程 91 | 1.[斯坦福 AI 公开课:如何建立类似 ChatGPT 的模型](https://www.youtube.com/watch?v=9vM4p9NN0Ts&t=72s) 92 | 93 | 这门公开课被认为是2024年最值得收藏的斯坦福 AI 公开课。本课程简明扼要地概述了如何建立类似 ChatGPT 的模型。即使没有编程基础也能搞懂大模型是如何运作的,是很好的 AI 基础教程。 94 | 95 | 96 | 97 | ## 关于周刊 98 | 99 | 开源 AIGC 周刊,为你挑选最值得分享的文章、教程、开源项目、副业变现等内容。希望帮助所有读者学习 AIGC,并增长职业和副业的收入。 100 | 101 | 周刊在 Github [开源](https://github.com/YOYZHANG/open-source-ai-weekly),可以通过 issue [投稿](https://github.com/YOYZHANG/open-source-ai-weekly/issues/new)。 102 | -------------------------------------------------------------------------------- /docs/2024-12-23/2024-12-23-10-46-54.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/2024-12-23-10-46-54.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-1.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-10.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-10.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-11.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-11.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-2.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-3.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-3.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-4.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-4.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-5.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-5.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-6.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-6.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-7.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-7.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-8.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-8.png -------------------------------------------------------------------------------- /docs/2024-12-23/image-9.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image-9.png -------------------------------------------------------------------------------- /docs/2024-12-23/image.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2024-12-23/image.png -------------------------------------------------------------------------------- /docs/2024-12-23/index.md: -------------------------------------------------------------------------------- 1 | --- 2 | title: '开源 AIGC 周刊 #4' 3 | pubDate: 2024-12-23 4 | author: '张XX' 5 | --- 6 | 7 | 每周精选最具潜力的 AI 开源工具与技术。我们为你解析项目亮点与应用场景,并推荐实用资源,帮助你在 AI 开发中领先一步!无论是学习还是实践,《开源 AIGC 周刊》都是你的每周灵感来源! 8 | 9 | ## 本周不可错过的 AI 开源项目 10 | 11 | ### [Genesis 🌟 17.8k](https://genesis-embodied-ai.github.io/) 12 | 13 | genesis 是一个综合性物理模拟平台,亮点是能够模拟各种材料和物理现象,能够生成复杂的人物动作,以及3D人物表情。上线短短4天已有 17.8k star,关注度可见一斑。目前物理引擎和模拟平台已开源,生成模型尚未开源。 14 | 15 | 16 | 17 | 18 | ### [BrushEdit 🌟 347](https://github.com/TencentARC/BrushEdit) 19 | BrushEdit 是腾讯开源的一体化图像编辑和修复技术。用户可以轻松移除对象、添加对象,进行背景编辑和对象替换。 20 | 21 | 22 | 23 | 24 | ### [CosyVoice 🌟8.6k](https://github.com/FunAudioLLM/CosyVoice) 25 | CosyVoice是一款多语言大型语音生成模型,提供推理、训练和部署全栈能力。从官方提供的Demo(https://funaudiollm.github.io/cosyvoice2/) 来看效果还不错,感兴趣可以试试。 26 | 27 | 28 | ### [Facebookresearch 🌟 11.8k](https://github.com/facebookresearch/AnimatedDrawings) 29 | facebookresearch 是一款开源的能让手绘人物动起来的工具,非常适合做表情包等。 30 | 31 | 32 | 33 | ### [NarratoAI 🌟 2.6k](https://github.com/linyqh/NarratoAI/tree/main) 34 | NarratoAI是一站式 AI 影视解说+自动化剪辑工具🎬🎞️,它基于LLM实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程,快速生产内容,感兴趣的可以试试。 35 | 36 | 37 | 38 | ### [ColorFlow 🌟163](https://github.com/TencentARC/ColorFlow) 39 | 腾讯推出的一款图片上色应用,用户可以通过上传多张风格参考图,为线稿完成上色。官方提供了在线试用地址,感兴趣的话可以试试。 40 | 41 | 42 | 43 | 44 | ## 最新行业动态 45 | ### 1. [OpenAI 12Days Day6-12](https://openai.com/12-days/) 46 | OpenAI Day12: 47 | - OpenAI 发布 o3模型,推理能力实现质的飞跃。官方预计在 2025年初正式上线。 48 | 49 | OpenAI Day11: 50 | - 展示了 ChatGPT 桌面应用与其他应用的协作。用户可以在 VSCode、Notion 等应用中直接与 ChatGPT 互动。 51 | 52 | OpenAI Day10: 53 | - 展示了可以打电话和发短信给ChatGPT. 54 | 55 | OpenAI Day9: 56 | - 推出了 o1 推理模型的 API, 支持函数调用和结构化输出。 57 | 58 | 59 | ### 2. [谷歌推出 Gemini 2.0 Flash Thinking](https://x.com/JeffDean/status/1869789813232341267) 60 | 61 | 62 | 这是一款能明确显示其思维的实验模型,它提供了完整的思考步骤。目前可以在 AI Studio 上免费使用,API 也是免费的,每天 1500 次。 63 | 64 | 65 | 66 | ### 3. [GitHub Copilot 推出免费版本](https://github.blog/news-insights/product-news/github-copilot-in-vscode-free/) 67 | 68 | GitHub Copilot 现在推出了免费订阅版本,用户可以享受所有支持的模型,但每月最多只能使用 2000 个自动完成和 50 个 Chat 请求。不过,教育和开源开发者依然可以无限制访问。 69 | 70 | 71 | 72 | 73 | ### 4. [快手发布KLING AI 1.6](https://x.com/bdsqlsz/status/1869652575324393723) 74 | 快手发布 KLING AI 1.6 版本,该版本在提示词遵循、视觉美观和物理特效方面都有显著改进。 75 | 此外,1.5 模型也更新支持了标准模式和 720p 文生视频,比 Sora 强。 76 | 77 | 78 | 79 | ### 5. [字节推出豆包视觉理解模型](https://www.volcengine.com/docs/82379/1362931) 80 | 81 | 豆包视觉理解模型给豆包安上了 "眼睛",可以用手机摄像头展示实时画面,直接像豆包模型提问。从演示视频上看,模型的内容识别、理解和推理能力以及记忆能力都表现出色。 82 | API 现已上线火山引擎,免费提供 50 万 token,最便宜的 lite 模型,输入输出分别为 1.5 元、4.5 元/M token。 83 | 84 | 85 | 86 | 87 | ### 6. 谷歌推出 Veo2:顶级视频生成模型 88 | 谷歌发布了 Veo2 视频模型,支持文生视频和图生视频。该模型能够生成分辨率高达 4K 的视频,并能根据提示词完成相机控制,如广角镜头、POV 和无人机拍摄,更好地遵循物理效果。 89 | 从官方演示来看,效果非常出色,甚至优于 Sora。目前,还需要加入 VideoFX 的候补名单才有机会体验。 90 | 91 | 92 | 93 | ## 本周 AI 教程 94 | 1.[llm 资料合集 🌟 19.6k](https://github.com/Hannibal046/Awesome-LLM) 95 | 96 | 超全的llm资料仓库,按发布时间整理了所有 llm 相关的里程碑论文。不仅如此,它还包含 LLM 训练框架、部署 LLM 的工具、有关 LLM 的课程和教程以及所有公开可用的 LLM 检查点和 API。 97 | 98 | 99 | 100 | 101 | ## 关于周刊 102 | 103 | 开源 AIGC 周刊,为你挑选最值得分享的文章、教程、开源项目、副业变现等内容。希望帮助所有读者学习 AIGC,并增长职业和副业的收入。 104 | 105 | 周刊在 Github [开源](https://github.com/YOYZHANG/open-source-ai-weekly),可以通过 issue [投稿](https://github.com/YOYZHANG/open-source-ai-weekly/issues/new)。 106 | -------------------------------------------------------------------------------- /docs/2025-01-13/image-1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-1.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-10.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-10.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-11.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-11.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-2.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-3.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-3.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-4.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-4.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-5.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-5.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-6.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-6.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-7.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-7.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-8.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-8.png -------------------------------------------------------------------------------- /docs/2025-01-13/image-9.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image-9.png -------------------------------------------------------------------------------- /docs/2025-01-13/image.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-13/image.png -------------------------------------------------------------------------------- /docs/2025-01-13/index.md: -------------------------------------------------------------------------------- 1 | --- 2 | title: '开源 AIGC 周刊 #6' 3 | pubDate: 2025-01-013 4 | author: '张XX' 5 | --- 6 | 7 | 每周精选最具潜力的 AI 开源工具与技术。我们为你解析项目亮点与应用场景,并推荐实用资源,帮助你在 AI 开发中领先一步!无论是学习还是实践,《开源 AIGC 周刊》都是你的每周灵感来源! 8 | 9 | ## 本周不可错过的 AI 开源项目 10 | 11 | ### [微软开源 phi-4 模型:14B 参数,性能超越 GPT-4o 🌟 1.1k](https://huggingface.co/microsoft/phi-4) 12 | phi-4 是微软刚刚开源的最强小参数模型,其参数仅为 14B。 13 | 14 | 在各种基准测试中,phi-4 对比同参数量的模型表现优异,甚至在 GPQA 和 MATH 基准测试中超过了 GPT-4o。 15 | 16 | ### [SAI 开源 SPAR3D:一秒内从单图生成可编辑 3D 模型 🌟 396](https://github.com/Stability-AI/stable-point-aware-3d) 17 | 18 | SPAR3D 是 SAI 最近开源的一项图生 3D 技术,能够在短短一秒内从单张图片生成可编辑的 3D 模型。这项技术对于商业和非商业用途均免费开放,只要年收入小于 100 万美元即可使用。目前,代码和模型都已经公开发布。 19 | 20 | 21 | 22 | 23 | ### [VITA-1.5:开源多模态视频语音大模型 🌟 1.8k](https://github.com/VITA-MLLM/VITA) 24 | VITA-1.5 是一个开源的多模态视频语音大模型,类似于 GPT-4o,支持实时视频语音交互。它基于 Qwen2.5 模型,具备随时打断的功能。 25 | 26 | 27 | 28 | 29 | ### [khoj 22.1k](https://github.com/khoj-ai/khoj) 30 | khoj 是一款开源的个人化AI助手,支持离线化,能够同时支持检索用户本地的markdown 和 pdf 等文件,以及在线的网址等。从而优雅的做到个人知识管理与搜索引擎替代。 31 | 32 | 33 | 34 | ### [storm 🌟 17.9k](https://github.com/stanford-oval/storm) 35 | 36 | 37 | 斯坦福大学开源了一款写作工具 storm,能自动生成类似维基百科的长篇文章。用户只需输入一个主题,storm 便可以在短时间内整合网络信息,生成高质量的研究文章。 38 | 39 | 40 | 41 | ### [openHands 🌟 40.5k](https://docs.all-hands.dev/) 42 | 43 | 44 | OpenHands 是一款完全开源的编程工具,能够像人类一样编写代码、使用命令行、浏览网页等。被誉为超越 cursor 的编程方式。 45 | 46 | 47 | 48 | 49 | 50 | ### [Adobe FaceLift:单张照片生成高保真 3D 头部模型 🌟 215](https://github.com/weijielyu/FaceLift) 51 | FaceLift 将单张人脸图像作为输入,并生成高保真三维高斯头部表示。生成的高斯表示法可实现高质量的全头部新颖视图合成(NVS),同时准确捕捉面部和头发的精细细节。 52 | 53 | 54 | 55 | 56 | 57 | 58 | ### [TransPixar 🌟 573](https://github.com/wileewang/TransPixar) 59 | 60 | 61 | TransPixar 是 Adobe 最新发布的一项创新技术,能够通过文本和图像生成透明背景的视频。 62 | 63 | 64 | 65 | ## 最新行业动态 66 | ### 1. [Grok IOS 发布](https://apps.apple.com/us/app/grok/id6670324846) 67 | 68 | 69 | Grok iOS App 现已上线美区 App Store,支持生成图像和对话。用户需要使用 X 账号登录,以实时访问 X 和 Web 数据。 70 | 71 | 72 | 73 | ### 2. [阿里通义团队推出 Qwen Chat:支持全系列 Qwen 模型](https://chat.qwenlm.ai/) 74 | 75 | 76 | Qwen Chat 是阿里通义团队近日上线的一款基于开源的 Open WebUI 的 WebUI,支持 Qwen 全系列模型。 77 | 78 | 模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型,以及 Qwen2.5-Coder-32B-Instruct 编程模型。 79 | 80 | 81 | 82 | 83 | ### 3. [快手 Kling APP 登陆美区 App Store,安卓版即将推出](https://apps.apple.com/us/app/klingai/id6738049229) 84 | 85 | 86 | Kling APP 现已正式上架美区 App Store,安卓版本也即将上线。功能与 web版的相似。 87 | 88 | 89 | 90 | 91 | 92 | ### 4. [Dify v1.0.0-beta 发布:全新 Marketplace 和插件系统上线](https://marketplace.dify.ai/) 93 | 94 | 95 | Dify发布了 v1.0.0-beta 版本,带来了全新的插件系统。现在,模型和工具等都成为了插件系统的一部分,用户可以更方便地扩展和定制功能。 96 | 97 | 98 | 99 | 100 | ### 5. [NVIDIA 推出 Project DIGITS:高性能 AI 超级计算机](https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-every-desk-and-at-every-ai-developers-fingertips) 101 | 102 | 103 | Project DIGITS 是 NVIDIA 推出的一款搭载 GB10 芯片的 AI 超级计算机,能够运行 200B 参数的模型。该设备将于今年 5 月发售,起价 3000 美元。Project DIGITS 提供了 4TB 的 SSD,128G 的统一内存,支持 Wifi、蓝牙和 USB 连接,体积看起来比 Mac mini 还要小。 104 | 105 | 106 | 107 | 108 | 109 | ## 关于周刊 110 | 111 | 开源 AIGC 周刊,为你挑选最值得分享的文章、教程、开源项目、副业变现等内容。希望帮助所有读者学习 AIGC,并增长职业和副业的收入。 112 | 113 | 周刊在 Github [开源](https://github.com/YOYZHANG/open-source-ai-weekly),可以通过 issue [投稿](https://github.com/YOYZHANG/open-source-ai-weekly/issues/new)。 114 | -------------------------------------------------------------------------------- /docs/2025-01-20/image-1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-20/image-1.png -------------------------------------------------------------------------------- /docs/2025-01-20/image-2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-20/image-2.png -------------------------------------------------------------------------------- /docs/2025-01-20/image-3.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-20/image-3.png -------------------------------------------------------------------------------- /docs/2025-01-20/image-4.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-20/image-4.png -------------------------------------------------------------------------------- /docs/2025-01-20/image-5.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-20/image-5.png -------------------------------------------------------------------------------- /docs/2025-01-20/image-6.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-20/image-6.png -------------------------------------------------------------------------------- /docs/2025-01-20/image-7.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-20/image-7.png -------------------------------------------------------------------------------- /docs/2025-01-20/image.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-20/image.png -------------------------------------------------------------------------------- /docs/2025-01-20/index.md: -------------------------------------------------------------------------------- 1 | --- 2 | title: '开源 AIGC 周刊 #7' 3 | pubDate: 2025-01-20 4 | author: '张XX' 5 | --- 6 | 7 | 每周精选最具潜力的 AI 开源工具与技术。我们为你解析项目亮点与应用场景,并推荐实用资源,帮助你在 AI 开发中领先一步!无论是学习还是实践,《开源 AIGC 周刊》都是你的每周灵感来源! 8 | 9 | ## 本周不可错过的 AI 开源项目 10 | 11 | ### [whisper 🌟 74.7k](https://github.com/openai/whisper?tab=readme-ov-file) 12 | 13 | OpenAI 开源了一款语音自动识别系统,支持多语言(包含中文),同时提供了API接口。可以用来为视频自动生成字幕、实时将会议内容转录,语言学习等。 14 | 15 | 16 | 17 | 18 | ### [zerox 🌟 8.7k](https://github.com/getomni-ai/zerox?tab=readme-ov-file) 19 | 20 | zerox 能够将pdf文件转成markdown 格式。 21 | 22 | 23 | 24 | ### [CopilotKit 🌟 15.7k](https://github.com/CopilotKit/CopilotKit) 25 | 26 | ### [whisper 🌟 74.7k](https://huggingface.co/Skywork/SkyReels-V1-Hunyuan-I2V) 27 | 28 | 昆仑万维开源 SkyReels-V1 视频模型,专注于 AI 短剧创作。该模型的主页介绍表示其通过对千万级高质量影视数据的微调,具备生成电影级光影效果、细腻表情和自然动作的能力。 29 | 目前,该模型已经开源,并且支持商业用途。 30 | 31 | 32 | 33 | 34 | ### [zerox 🌟 8.7k](https://github.com/getomni-ai/zerox?tab=readme-ov-file) 35 | zerox 能够将pdf文件转成markdown 格式, 36 | 37 | 38 | 39 | 40 | ### [CopilotKit 🌟 15.7k](https://github.com/CopilotKit/CopilotKit) 41 | CopilotKit 提供了多种 API 接口,允许开发者轻松地将 AI 功能集成到他们的应用中,例如自动补全、智能推荐等。官方提供了很多应用示例,有兴趣的可以看看。 42 | 43 | 44 | ### [LocalAI 🌟 28.8k](https://github.com/mudler/LocalAI) 45 | 46 | LocalAI 是 OpenAI、Claude 和其他软件的免费开源替代品。 可以自托管,本地优先。 可直接替代 OpenAI 在硬件上运行。 无需 GPU。 可运行 gguf、变压器、扩散器和更多模型架构。 功能 生成文本、音频、视频、图像、语音克隆、分布式、P2P 推理。 47 | 48 | 49 | 50 | 51 | ### [MangaNinja 🌟 341](https://github.com/ali-vilab/MangaNinjia) 52 | 53 | MangaNinja 是一款创新的开源线稿上色工具,它允许用户通过输入线稿和参考图片来生成与参考图一致的颜色。 该工具支持多角色草图参考多张图片和单角色草图参考多张图片。 54 | 55 | 56 | 57 | 58 | ### [Kokoro-TTS 2k](https://huggingface.co/hexgrad/Kokoro-82M) 59 | 60 | Kokoro 是一个前沿的 TTS 模型,仅有 82M参数(文本输入/音频输出), 支持中文。 截至 2025 年 1 月 2 日,已发布了 10 个独特的语音包。 在发布前的几周,Kokoro v0.19 是 TTS Spaces Arena 排名第一的模型。 61 | 62 | 63 | 64 | ### [awesome-cursorrules 6.6k](https://github.com/PatrickJS/awesome-cursorrules) 65 | 66 | awesome-cursorrules 集合了所有超赞 .cursorrules 文件。 .cursorrules 文件定义了Cursor AI在生成代码时要遵循的自定义规则,让你可以根据自己的特定需求和偏好来调整它的行为。 67 | 68 | 69 | ## 最新行业动态 70 | 71 | ### 1. [Cursor 获 1.05 亿美金 B 轮融资](https://www.cursor.com/blog/series-b) 72 | 73 | Cursor 官方发布已经从 Thrive Capital、Andreessen Horowitz、Benchmark 和现有投资者那里获得了 1.05 亿美元的 B 轮融资。 这笔融资将用来打造一个比任何现有人类程序员都厉害的 AI 程序员。 74 | 75 | 76 | 77 | ### 2. [OpenAI 推出 ChatGPT 任务功能:支持单次和计划任务](https://x.com/OpenAI/status/1879267274185756896?mx=27) 78 | 79 | ChatGPT 推出了任务(Task) 功能。只要告诉 ChatGPT 需求和时间,它就会准时通知你。 目前,这一功能仅对付费用户开放。 80 | 81 | LocalAI 是 OpenAI、Claude 和其他软件的免费开源替代品。 可以自托管,本地优先。 可直接替代 OpenAI 在硬件上运行。 无需 GPU。 可运行 gguf、变压器、扩散器和更多模型架构。 功能 生成文本、音频、视频、图像、语音克隆、分布式、P2P 推理。 82 | 83 | 84 | 85 | ### [MangaNinja 🌟 341](https://github.com/ali-vilab/MangaNinjia) 86 | MangaNinja 是一款创新的开源线稿上色工具,它允许用户通过输入线稿和参考图片来生成与参考图一致的颜色。 该工具支持多角色草图参考多张图片和单角色草图参考多张图片。 87 | 88 | 89 | 90 | ### [Kokoro-TTS 2k](https://huggingface.co/hexgrad/Kokoro-82M) 91 | Kokoro 是一个前沿的 TTS 模型,仅有 82M参数(文本输入/音频输出), 支持中文。 截至 2025 年 1 月 2 日,已发布了 10 个独特的语音包。 在发布前的几周,Kokoro v0.19 是 TTS Spaces Arena 排名第一的模型。 92 | 93 | 94 | 95 | 96 | ### [MakeAnything:一致性图片序列生成模型 6.6k](https://github.com/PatrickJS/awesome-cursorrules) 97 | ![alt text](image-4.png) 98 | awesome-cursorrules 集合了所有超赞 .cursorrules 文件。 .cursorrules 文件定义了Cursor AI在生成代码时要遵循的自定义规则,让你可以根据自己的特定需求和偏好来调整它的行为。 99 | 100 | 101 | 102 | 103 | ## 最新行业动态 104 | ### 1. [阿里 WANX 2.1 视频生成模型即将开源](https://x.com/Alibaba_WanX) 105 | 106 | ![alt text](image-1.png) 107 | Cursor 官方发布已经从 Thrive Capital、Andreessen Horowitz、Benchmark 和现有投资者那里获得了 1.05 亿美元的 B 轮融资。 这笔融资将用来打造一个比任何现有人类程序员都厉害的 AI 程序员。 108 | 109 | ### 2. [xAI 发布 Grok 3:超越 DeepSeek R1](https://x.com/i/broadcasts/1gqGvjeBljOGB) 110 | 111 | ![alt text](image-3.png) 112 | 113 | Grok 3 现已发布,直播中展示了其在多个基准测试中的卓越表现,包括数学、科学和编程等领域,超越了 OpenAI GPT-4o、Google Gemini、DeepSeek V3 以及 Anthropic Claude 等顶尖模型。其推理模式(代号 "chocolate")在 Chatbot Arena 平台的盲测中目前排名第一。 114 | 115 | ### 3. [FLUX Pro Finetuning API:轻松定制你的图像模型](https://blackforestlabs.ai/announcing-the-flux-pro-finetuning-api/) 116 | 117 | 黑森林实验室宣布推出 FLUX Pro Finetuning API,创作者可以用自己的图像和概念来定制 FLUX.1 [pro],从而对最终结果有更多的控制权。 118 | 119 | 120 | 121 | ## 本周 AI 教程 122 | 123 | 124 | 125 | 126 | ## 本周 AI 教程 127 | 1.[minimind 🌟 5.5k](https://github.com/jingyaogong/minimind) 128 | 129 | minimind 是一个用3小时完全从0训练出来的小参数GPT。该项目同时提供了详细的数据集和训练方法,能帮助大家更好的学习如何训练模型。 130 | 131 | 132 | 133 | ## 关于周刊 134 | 135 | 开源 AIGC 周刊,为你挑选最值得分享的文章、教程、开源项目、副业变现等内容。希望帮助所有读者学习 AIGC,并增长职业和副业的收入。 136 | 137 | 周刊在 Github [开源](https://github.com/YOYZHANG/open-source-ai-weekly),可以通过 issue [投稿](https://github.com/YOYZHANG/open-source-ai-weekly/issues/new)。 138 | -------------------------------------------------------------------------------- /docs/2025-01-6/image-1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-6/image-1.png -------------------------------------------------------------------------------- /docs/2025-01-6/image-2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-6/image-2.png -------------------------------------------------------------------------------- /docs/2025-01-6/image-3.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-6/image-3.png -------------------------------------------------------------------------------- /docs/2025-01-6/image-4.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-6/image-4.png -------------------------------------------------------------------------------- /docs/2025-01-6/image-5.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-6/image-5.png -------------------------------------------------------------------------------- /docs/2025-01-6/image-6.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-6/image-6.png -------------------------------------------------------------------------------- /docs/2025-01-6/image-7.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-6/image-7.png -------------------------------------------------------------------------------- /docs/2025-01-6/image-8.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-6/image-8.png -------------------------------------------------------------------------------- /docs/2025-01-6/image.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-01-6/image.png -------------------------------------------------------------------------------- /docs/2025-01-6/index.md: -------------------------------------------------------------------------------- 1 | --- 2 | title: '开源 AIGC 周刊 #4' 3 | pubDate: 2025-01-06 4 | author: '张XX' 5 | --- 6 | 7 | 每周精选最具潜力的 AI 开源工具与技术。我们为你解析项目亮点与应用场景,并推荐实用资源,帮助你在 AI 开发中领先一步!无论是学习还是实践,《开源 AIGC 周刊》都是你的每周灵感来源! 8 | 9 | ## 本周不可错过的 AI 开源项目 10 | 11 | ### [LatentSync 🌟 600](https://github.com/bytedance/LatentSync) 12 | LatentSync 是字节推出的开源嘴形同步模型,效果很好。 LatentSync 基于Stable Diffusion,针对时间一致性做了优化,推理只需要6.5G显存。 13 | 14 | 15 | 16 | ### [StereoCrafter:一键将普通视频转为 3D 视频 🌟 78](https://github.com/TencentARC/StereoCrafter) 17 | 18 | 腾讯开源 StereoCrafter, 能够将任何普通视频转换为红蓝、VR 或左右格式的 3D 视频。 19 | 20 | 21 | 22 | 23 | ### [try-off-anyone 🌟 87](https://github.com/ixarchakos/try-off-anyone) 24 | try-off-anyone 用于从人物照片中提取上衣,实现所谓的“反向试穿”。 25 | 26 | 27 | 28 | ### [华佗GPT o1 🌟478](https://github.com/FreedomIntelligence/HuatuoGPT-o1) 29 | HuatuoGPT-o1 是专为高级医学推理设计的医学 LLM。它可以识别错误、探索替代策略并完善答案。它利用可验证的医学问题和专门的医学验证器,通过以下方式推进推理: 30 | 31 | ![alt text](image-3.png) 32 | 33 | 34 | ### [CogAgent-9B-20241220 🌟 453](https://github.com/facebookresearch/AnimatedDrawings) 35 | 智谱最新开源的 CogAgent-9B-20241220 模型,类似于 Claude Computer use。例如,下方例子是CogAgent 祝你圣诞快乐,让大模型自动为你的朋友们送上圣诞祝福吧。 36 | 37 | 38 | 39 | 40 | ### [smolagents 🌟 2.6k](https://huggingface.co/blog/smolagents) 41 | smolagents:快速搭建Agent的代码库。核心代码简洁,仅一千行代码,支持实现写代码的Agent、支持沙盒环境运行、支持多种工具和模型。 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | ### [AgiBot-World 🌟 979](https://github.com/OpenDriveLab/Agibot-World) 50 | AgiBot-World 包含了来自 100 个机器人的 100 多万条轨迹。其中包括100 多个 1:1 复制的真实场景,横跨 5 个目标领域。 51 | 52 | 53 | 54 | ## 最新行业动态 55 | ### 1. [DeepSeek-V3 发布:性能领先,速度飞跃,API 定价调整](https://github.com/deepseek-ai/DeepSeek-V3) 56 | 57 | ![alt text](image-1.png) 58 | 59 | DeepSeek-V3 首个版本正式上线并同步开源。该模型在多项评测中超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上与世界顶尖的闭源模型 GPT-4o 相媲美。之前令人诟病的吐字速度从 20 TPS 大幅提高至 60 TPS,比 V2.5 提升了 3 倍。 60 | 61 | 不过,此次更新也在预期内调整了 API 服务定价,每百万输入 tokens 2 元(涨价 2 倍),每百万输出 tokens 8 元(涨价 4 倍)。官方为了过渡此次涨价,还特意提供了 45 天的优惠价格体验期,至 2025 年 2 月 8 日起 API 价格将恢复至新版本的价格,也算是良心。 62 | 63 | ### 2. [PixVerse V3.5](https://app.pixverse.ai/onboard) 64 | 65 | 只需20秒就能生成8秒长的视频(640*352),质量也还可以。 66 | 67 | 68 | ## 本周 AI 教程 69 | 1.[谷歌 Agents 白皮书](https://www.kaggle.com/whitepaper-agents) 70 | 71 | 介绍了Agent的基础概念和基于LangChain的简单实现。 72 | 73 | 74 | 75 | ## 关于周刊 76 | 77 | 开源 AIGC 周刊,为你挑选最值得分享的文章、教程、开源项目、副业变现等内容。希望帮助所有读者学习 AIGC,并增长职业和副业的收入。 78 | 79 | 周刊在 Github [开源](https://github.com/YOYZHANG/open-source-ai-weekly),可以通过 issue [投稿](https://github.com/YOYZHANG/open-source-ai-weekly/issues/new)。 80 | -------------------------------------------------------------------------------- /docs/2025-02-24/image-1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-02-24/image-1.png -------------------------------------------------------------------------------- /docs/2025-02-24/image-2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-02-24/image-2.png -------------------------------------------------------------------------------- /docs/2025-02-24/image-3.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-02-24/image-3.png -------------------------------------------------------------------------------- /docs/2025-02-24/image-4.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-02-24/image-4.png -------------------------------------------------------------------------------- /docs/2025-02-24/image-5.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-02-24/image-5.png -------------------------------------------------------------------------------- /docs/2025-02-24/image-6.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-02-24/image-6.png -------------------------------------------------------------------------------- /docs/2025-02-24/image-7.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-02-24/image-7.png -------------------------------------------------------------------------------- /docs/2025-02-24/image-8.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-02-24/image-8.png -------------------------------------------------------------------------------- /docs/2025-02-24/image.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/YOYZHANG/open-source-ai-weekly/4bfad433458691fd4a258fe12df7f03e5c6c759a/docs/2025-02-24/image.png -------------------------------------------------------------------------------- /docs/2025-02-24/index.md: -------------------------------------------------------------------------------- 1 | --- 2 | title: '开源 AIGC 周刊 #8' 3 | pubDate: 2025-02-24 4 | author: '张XX' 5 | --- 6 | 7 | 每周精选最具潜力的 AI 开源工具与技术。我们为你解析项目亮点与应用场景,并推荐实用资源,帮助你在 AI 开发中领先一步!无论是学习还是实践,《开源 AIGC 周刊》都是你的每周灵感来源! 8 | 9 | ## 本周不可错过的 AI 开源项目 10 | 11 | ### [R1 1776 🌟 1.48k](https://huggingface.co/perplexity-ai/r1-1776) 12 | 13 | R1 1776 是 Perplexity 开源的无审查版本的 DeepSeek 推理模型,支持通过 Sonar API 方式调用。 14 | 15 | 16 | 17 | 18 | ### [Mastra 🌟 4.7k](https://github.com/mastra-ai/mastra) 19 | Mastra 是一个 Typescript 框架,可快速构建人工智能应用程序和功能。 它提供了工作流、代理、RAG、集成功能。可以在本地机器上运行 Mastra,也可以部署到服务器上。 20 | 21 | 22 | ### [browser-use 🌟 31.4k](https://github.com/browser-use/browser-use?tab=readme-ov-file) 23 | 24 | browser-use 是将 Agent 与浏览器连接起来的最简单方法。例如你可以利用它实现将商品加入购物车并下单;阅读你的简历并自动在浏览器中申请工作。 25 | ![alt text](image-6.png) 26 | 27 | 28 | ### [pandas-ai 🌟 15.4k](https://github.com/sinaptik-ai/pandas-ai) 29 | pandas-ai 用于与数据库或数据集(SQL、CSV、parquet)聊天。 PandasAI 使用 LLM 和 RAG 使数据分析成为对话式的。 30 | 31 | 32 | 33 | 34 | ### [tinygrad🌟 28.1k](https://github.com/tinygrad/tinygrad) 35 | tinygrad 是一款出色的深度学习框架,它的架构其极其简单,并支持推理和训练。 如果说 XLA 是 CISC,那么 tinygrad 就是 RISC。 36 | 37 | ### [Light-A-Video 330](https://github.com/bcmi/Light-A-Video/) 38 | Light-A-Video 是一个开源的无需训练的视频重打光技术,效果类似于 IC-Light,但特别之处在于它支持视频处理。 39 | 40 | ![alt text](image-3.png) 41 | 42 | ### [Step-Video-T2V 2k](https://github.com/stepfun-ai/Step-Video-T2V) 43 | Step-Video-T2V 开源了其最新的文生视频模型,该模型拥有 300 亿参数,能够生成长达 204 帧的高质量视频。官方建议使用配备 80G 内存的 GPU 进行运行。代码已基于 MIT 许可证开源,支持商业用途。 44 | 45 | 46 | 47 | 48 | ## 最新行业动态 49 | ### 1. [阿里 WANX 2.1 视频生成模型即将开源](https://x.com/Alibaba_WanX) 50 | WanX 团队昨晚宣布即将开源其最新的 WANX 2.1 视频生成模型。 51 | 52 | ![alt text](image-8.png) 53 | ### 2. [Grok3 Beta 已可以免费使用](https://grok.com/) 54 | 55 | Grok3 其计算能力是之前最先进模型的 10 倍,支持深度思考功能,但该功能 24 小时内只能使用 2 次。 56 | 57 | ### 3. [腾讯混元 T1 推理模型现已上线腾讯元宝](https://mp.weixin.qq.com/s/q5YFZrcTDYgM-LeRyGHQYQ) 58 | 59 | 腾讯混元团队宣布其自研推理模型 Hunyuan T1 现已上线腾讯元宝进行灰度测试,性能比肩 Deepseek R1。 60 | 61 | 62 | 63 | 64 | ### 4. [微软推出 OmniParser V2.0:将大语言模型转化为 GUI 交互智能体](https://huggingface.co/microsoft/OmniParser-v2.0) 65 | 微软的 OmniParser 近日发布了 V2 更新,这一更新旨在将任何大语言模型(LLM)转化为能够理解和交互图形用户界面(GUI)的智能体。 66 | 67 | 68 | 69 | ### 5. [百度文心大模型 4.5 系列即将开源](https://mp.weixin.qq.com/s/VEPMufLTlSyysy1cmyHk4Q) 70 | 71 | 百度将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。同时,百度搜索也将全面接入 DeepSeek 和文心大模型最新的深度搜索功能。 72 | 73 | ### 6. [谷歌 Whisk:通过图像混合生成新图片](https://labs.google/fx/tools/whisk) 74 | 75 | Whisk 是谷歌实验室的新实验项目,用户可以通过上传或生成图像来定义主题、场景和风格,然后将它们混合生成新图片。 76 | 77 | 78 | 79 | 80 | ## 本周 AI 教程 81 | 1.[antropics 🌟 9.4k](https://github.com/anthropics/courses) 82 | 83 | Antropics 官方推出的教程包含以下内容: 84 | - Claude SDK 的使用:获取 API 密钥、使用模型参数、编写多模态提示、流式响应等。 85 | - Prompt教程:关键提示技术的全面分步指南。 86 | - 真实世界提示:学习如何将提示技术融入复杂的真实世界提示中。 87 | - 提示评估:学习如何编写生产提示评估,以衡量提示的质量。 88 | - 工具使用:讲授在使用 Claude 的工作流程中成功实施工具使用所需的一切知识。 89 | 90 | ## 关于周刊 91 | 92 | 开源 AIGC 周刊,为你挑选最值得分享的文章、教程、开源项目、副业变现等内容。希望帮助所有读者学习 AIGC,并增长职业和副业的收入。 93 | 94 | 周刊在 Github [开源](https://github.com/YOYZHANG/open-source-ai-weekly),可以通过 issue [投稿](https://github.com/YOYZHANG/open-source-ai-weekly/issues/new)。 95 | --------------------------------------------------------------------------------