【2025-03-23】AI行业最新动态

人工智能2周前更新 Gang
61 00
【2025-03-23】AI行业最新动态

AI行业最新动态

AI行业在过去24小时内经历了多项重大发展,涉及Anthropic、Google和OpenAI等主要参与者的新功能和模型发布。这些更新增强了AI系统的能力和实用性,为用户在各个领域提供了更强大的工具。

1. Claude支持联网搜索

Anthropic的Claude AI助手在其官方网站上新增了联网搜索功能,这一更新使Claude能够通过访问网络上的实时信息提供更及时和相关的回应。这一变化在全网引起了广泛的欢迎,因为它消除了用户手动搜索的需要,使Claude成为获取最新信息的更便捷工具。

此前,Claude的知识仅限于其训练数据,缺乏对近期事件或发展的动态更新。联网搜索功能的加入显著提升了Claude的实用性,使其能够处理需要最新信息的任务,如新闻更新或市场趋势分析。Anthropic的公告Anthropic's announcement on Claude's internet search capability确认了这一更新,并指出Claude现在可以直接引用网络来源,提供事实检查的便利。

2. Claude Code支持输入网址

Claude Code,Anthropic的编码辅助工具,现在支持输入网址作为编程参考,允许用户提供包含代码或文档的网页或PDF链接,Claude可以从中学习并在回应中引用。这一功能通过Reddit上的用户讨论得到验证,用户分享了使Claude从网页URL和PDF学习的方法,包括将下载的内容附加到新聊天中或通过如TypingMind的API集成实现网络访问。

3. Google AI Studio生图功能安全性的改进

Google一直在其AI Studio的图像生成功能上努力改善安全性和可用性。虽然没有找到2025年3月具体公告提到“显著减少安全误判”,但Google对其AI模型的一般安全改进可能也惠及图像生成功能。这些改进包括实施强化学习技术和自动化红队测试,以评估和减轻AI模型中的风险。

Google的努力体现在其2024年负责任AI进展报告Google's Responsible AI Progress Report中,强调通过新框架和原则确保AI安全和负责任发展。例如,Gemini 2.0模型的更新Gemini 2.0 model updates提到使用Gemini自身批评回应的新强化学习技术,以及自动化红队测试来评估安全风险。这些措施可能减少了图像生成中的误判,如生成不适当或有害内容,从而提高可用性。

4. OpenAI新STT模型取代Whisper

OpenAI在2025年3月发布了新的语音转录STT模型“gpt-4o-transcribe”和“gpt-4o-mini-transcribe”,取代之前的Whisper模型。旨在更准确和高效,特别是在口音语音上的表现更好,且减少幻觉。

这些模型通过OpenAI的API提供,是Whisper的重大升级,提供更好的转录质量和更低的词错误率,尤其是在泰米尔语、泰卢固语、马拉雅拉姆语和卡纳达语等语言上。文章提到,gpt-4o-transcribe的词错误率接近30%,显著优于Whisper。这标志着STT技术对开发者和用户更易访问和有效的重大步骤,符合OpenAI构建更强大AI系统的更广泛努力。

5. OpenAI新TTS模型

OpenAI还发布了新的文本转语音(TTS)模型“gpt-4o-mini-tts”,价格非常实惠,尽管质量一般,但提供独特功能:通过自然语言提示控制合成语音的情感。

该模型允许用户通过提示如“像疯狂科学家一样说话”或“听起来很兴奋”来控制语音情感,提供更具表现力和多样的输出。它可在OpenAI.FM试用,为用户提供实验其能力的平台。虽然质量可能不高,但其实惠性和灵活性使其成为情感语气重要的应用中的有前景工具,如语音助手或教育内容。

引用

© 版权声明

相关文章

暂无评论

none
暂无评论...