ai_news_summary_2025-06-26

AINews - 2025-06-26

原文链接

📰 十大AI新闻要点

1. Context Engineering成为AI工程关键趋势

Cognition AI的Walden Yan提出”Context Engineering”概念,多位AI领袖(包括Karpathy、LangChain创始人等)认同这是比”Prompt Engineering”更准确的术语,指管理LLM上下文窗口的复杂技术,涉及RAG、工具调用、状态维护等。

2. Google发布开源Gemini CLI工具

Google推出Apache 2.0许可的Gemini终端代理,提供每日1000次免费请求和100万token上下文窗口,支持MCP协议,被视为与Anthropic的Claude Code直接竞争。

3. Anthropic图书扫描训练数据获法院支持

联邦法官裁定Anthropic购买并扫描实体书训练Claude模型属于合理使用,但保留700万盗版电子书的行为构成侵权,赔偿金额将由陪审团决定。

4. DeepMind发布AlphaGenome基因组分析模型

新型混合卷积+Transformer架构可处理100万碱基对输入,在转录调控和剪接预测等任务上达到SOTA,R值达0.8-0.85。

5. Jan-nano-128k小模型性能超越大模型

Menlo Research发布的4B参数模型在SimpleQA基准测试中得分83.2,超过Deepseek-671B(78.2)和GPT-4o(62.5),采用YaRN扩展技术实现128k上下文窗口。

6. OpenAI为Pro用户新增云存储连接器

ChatGPT现可连接Google Drive、Dropbox、SharePoint和Box,允许用户将工作文件内容作为上下文使用(EEA、瑞士和英国除外)。

7. DSPy框架获Shopify CEO公开推荐

Tobi Lütke称DSPy是其”首选Context Engineering工具”,该框架基于Signatures和Modules的编程模型正在获得学术界和业界的广泛关注。

8. Mistral Small 3.2展现超规格性能

24B参数模型在写作和逻辑任务上超越Gemma 3 27B和Llama 3.3 70B,推荐推理参数:temperature 0.15, top-p 1.0。

9. AI视频生成技术新突破

Kling AI推出Motion Control功能可将源视频动作迁移到新图像,RunwayML的Gen-4 References模型也同期发布API版本。

10. Perplexity CEO呼吁重建Android系统

Arav Srinivas认为当前Android系统为广告业务优化,需要为AI时代重构,并预言浏览器将成为AI智能体进化的”原始汤”。


🛠️ 十大工具产品要点

1. Gemini CLI终端工具

开源终端代理,支持1百万token上下文,60 RPM速率限制,1000次/日免费请求,需要Gemini云API但提供数据收集退出选项。

2. LM Studio新增MCP支持

v0.3.17版本新增Model Compatibility Protocol支持,可连接本地LLM,新增33种语言界面和Solarized Dark主题。

3. ThermoAsk自调节温度技术

让LLM动态设置自身temperature参数的技术实现,已提供Ollama Python SDK和Qwen2.5-7B的示例代码。

4. OpenRouter模型可用性API

新增API可监控各模型在线状态,BYOK功能支持密钥预测试和用量限制。

5. LlamaIndex发布MCP服务器模板

开源Next.js模板可快速构建Claude兼容的MCP服务器。

新功能允许用户在Claude内部构建和共享AI生成内容,支持实时协作。

7. MakoGenerate GPU内核生成器

AI代理可自动生成优化GPU内核代码,支持H100/B200部署,VS Code扩展开发中。

8. Hyperbolic XYZ廉价GPU租赁

提供H100每小时$0.99、RTX 4090每小时$0.28的租赁服务,适合预算有限的开发者。

9. BitNet演示版表现惊艳

1.58-bit量化模型在速度和响应质量上获得好评,Hugging Face Space已开放。

10. Cerebras云服务性价比突出

晶圆级GPU服务价格与Blackwell相当但带宽较低,适合大规模训练任务。