作者stpiknow (H)
看板Google
标题[情报] 谷歌Project Astra和OpenAI的GPT-4o接连
时间Fri May 17 11:03:48 2024
谷歌Project Astra和OpenAI的GPT-4o接连登场,说明多模态AI助理时代来临
1. 情报or新闻 连结:
https://bit.ly/3yw1z2u
2. 内文:
在Google I/O 2024上,谷歌展示了成为通用助理的早期版本,称之为Project Astra,它
是一个即时、多模态AI助理(multimodal AI Assistant)。
Project Astra提供支援的代理程式是基於谷歌的Gemini模型和其他特定任务模型建立的
。它可以透过连续处理视讯和语音输入来更快地处理讯息。其很像刚刚获得OpenAI升级的
ChatGPT之GPT-4o。就像GPT-4o一样,Project Astra 可以像人类一样理解和回应世界,
它可以吸收并记住所看到和听到的内容,以了解背景并采取行动。您还可以自然地对其说
话,而不会出现延迟。
这为生成式AI助理开启了一套全新的范例。谷歌计划於2024年开始将Astra的功能添加到
其Gemini应用程式及其产品中。然而,虽然最终的目标是让Astra在谷歌的软体服务中无
缝使用。不过,为了谨慎推出,并且将产品化之路达到「以品质为导向」的水准。
展望未来,AI的故事将不再是关於模型本身,而是关於它们能为人们做些什麽。这个故事
都是关於代理的:机器人不仅与你交谈,而且实际上代表你完成任务。
无论是OpenAI或者是谷歌似乎愈来愈像地争夺同一领域,并且似乎对AI如何改变人们的生
活,以及随着时间的推移让人们如何使用它,有着共同的愿景。
另外,谷歌为了防止OpenAI抢占其搜寻引擎龙头的地位。在Google I/O 2024会议上,谷
歌也对其核心搜寻引擎进行了重大改变。从2024年5月中旬开始,所有美国用户都将在许
多常见搜寻结果的顶部看到「AI概述」,也就是AI生成的简短摘要答案,随後是可点击的
链接,下方散布着广告。
OpenAI的ChatGPT聊天机器人可以为许多问题提供了快速、完整的搜寻答案,如今也
与媒体公司签署了协议,提供最新资讯方式以改善其反应。甚至在5月13日OpenAI还展示
了为ChatGPT提供支援模型的更快、更便宜的版本,此举被视为试图抢夺谷歌风采,该模
型同样可以在单一介面中解释语音、视讯、影像和程式码。
另外,谷歌还透露了新的或改进的AI产品,包括Veo,其可以根据文字提示生成影片;
Imagen 3可以创建图片;Lyria是一个AI音乐生成模型。至於Gemini Advanced的订阅者,
将能够创建名为「Gems」的个人化聊天机器人来帮助完成特定任务。
最值得注意的是,谷歌的Project Astra似乎也对准了智慧眼镜市场,这也说明了谷歌正
在持续研发类似Meta和雷朋合作的智慧眼镜,期望在Project Astra准备好时,给市场一
个大惊喜呢
3.心得:
Google和OpenAI展示的多模态AI助理如Project Astra和GPT-4o,标志着AI助理时代的来
临,预示着AI将不仅能与人类互动,还能代表人类完成任务。这些技术的发展将极大地改
变我们的日常生活。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 203.145.192.245 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Google/M.1715915030.A.EEA.html