github_trending_2025-09-28

1. bytedance/Dolphin

Dolphin是字节跳动推出的文档图像解析模型,采用”先分析后解析”两阶段方法:首先生成自然阅读顺序的页面布局,再通过异构锚点提示并行解析文本、表格、公式等元素。该模型基于轻量架构实现高效并行处理,支持多页PDF解析,在文档结构化提取任务中表现优异,适用于智能文档处理场景。


2. ericciarla/trendFinder

Trend Finder是一款AI驱动的社交媒体趋势追踪工具,通过监控Twitter关键意见领袖和网站内容,结合Together AI进行智能分析,自动识别新兴趋势和产品发布,并推送Slack或Discord通知。帮助营销团队节省手动搜索时间,实时把握行业动态,快速响应市场机会。支持Docker部署,集成多平台API,适用于需要高效追踪热点和竞品动态的团队。


3. jellyfin/jellyfin

Jellyfin是一款开源媒体管理系统,提供服务器后端和API,支持用户自主管理和流媒体传输。基于.NET平台开发,具备跨平台兼容性,可替代Plex等商业方案。无需付费许可,支持多终端应用,适合搭建私有媒体库。


4. ZuodaoTech/everyone-can-use-english

Enjoy是一款AI驱动的英语学习助手,通过语音跟读、实时评估和智能对话功能,帮助用户提升口语和听力能力。项目支持网页和桌面端,结合自动化测试与持续部署,为学习者提供个性化、互动式的语言训练体验。


5. exo-explore/exo

Exo可将日常设备(手机、电脑、树莓派等)组建成分布式AI集群,支持LLaMA、Mistral等大模型。其核心创新在于动态模型分区技术,能根据设备资源自动分配计算负载,并采用P2P架构实现设备平等协作。无需配置即可自动发现设备,提供ChatGPT兼容API,让用户在家用硬件上低成本运行超大模型。


6. humanlayer/humanlayer

CodeLayer是基于Claude Code的开源IDE,通过编排AI编程代理解决复杂代码库中的难题。支持并行Claude会话和云端协作,提供键盘优先工作流和高级上下文工程,帮助开发团队实现高效AI驱动开发,显著提升编码效率。


7. onyx-dot-app/onyx

Onyx是一款开源AI平台,提供功能丰富的可自托管聊天界面,支持所有主流及自托管大语言模型。其核心优势在于集成智能体、联网搜索、RAG增强检索、多源知识连接等高级功能,具备企业级文档权限管理和安全特性,适用于从个人到大型团队的私有化部署场景。


8. google-gemini/gemini-cli

Gemini CLI是谷歌开源的终端AI助手,将Gemini大模型能力直接集成到命令行。支持代码理解生成、自动化脚本、文件操作等工具,具备100万token上下文和Google搜索实时信息获取能力。专为开发者设计,提供免费额度,可通过MCP协议扩展功能,极大提升终端工作效率。


9. gin-gonic/gin

Gin是基于Go语言的高性能HTTP Web框架,采用httprouter实现零内存分配路由,性能比Martini快40倍。专为构建REST API、微服务和Web应用设计,支持中间件扩展、JSON验证和崩溃恢复,兼具开发效率与运行时效能,适合高并发场景。


10. HKUDS/RAG-Anything

RAG-Anything是新一代多模态检索增强生成框架,支持文本、图像、表格、公式等混合内容的一体化处理。基于LightRAG构建,通过多阶段流水线实现文档解析、内容分析和跨模态知识图谱构建,解决了传统RAG系统无法有效处理非文本元素的痛点。适用于学术研究、技术文档等需要统一处理多模态内容的场景。


11. basecamp/omarchy

Omarchy是一款基于Hyprland的Arch Linux一键配置工具,专为Web开发者设计。通过单条命令即可将纯净Arch系统转化为现代化开发环境,自动集成各类命令行工具和预优化配置。其核心价值在于免去手动配置繁琐,提供开箱即用的美观桌面与高效开发工作流,显著降低Linux系统配置门槛。


12. is-a-dev/register

is-a.dev为开发者提供免费的子域名注册服务,通过GitHub提交PR即可快速获取个性化.is-a.dev域名。项目采用开源协作模式,支持多种DNS记录类型,并由Cloudflare赞助保障稳定性。特别适合个人技术博客、作品集等场景,让开发者低成本建立专业技术品牌形象。


13. ultralytics/ultralytics

Ultralytics YOLO提供前沿的实时目标检测模型,支持检测、分割、姿态估计等多任务。基于PyTorch构建,具备高速、高精度和易用性,适用于计算机视觉研发和工业部署。


14. netdata/netdata

Netdata是开源实时基础设施监控平台,提供每秒级指标采集和AI异常检测。具备零配置部署、边缘计算架构和跨平台支持,适用于从单机到云环境的全栈可观测性,帮助团队快速定位系统问题。


15. google-gemini/cookbook

Gemini API官方教程库,提供从快速入门到实战案例的完整学习路径。涵盖Gemini 2.5模型、多模态Live API、图像生成(Imagen/Veo)等核心功能,包含代码执行、实时交互、3D空间理解等高级特性。适合开发者快速掌握AI多模态应用开发,支持Python/Go/Node.js等主流语言SDK。