2025谷歌开发者大会有哪些值得关注的内容?
Alphabet(GOOGL.O)谷歌年度最盛大的开发者大会Google I/O 2025于本周二和周三在加州山景城的海岸线圆形剧场举行。这是展示其全产品线发布动态的舞台,涵盖安卓、Chrome、谷歌搜索、YouTube,以及当然不可或缺的AI聊天机器人Gemini等众多领域。
谷歌还专门为安卓更新举办了一场独立活动。公司宣布了多项新功能,包括寻找遗失安卓手机和其他物品的新方式、Advanced Protection高级保护计划新增的设备级安全功能、防诈骗防盗的安全工具,以及全新设计语言Material 3 Expressive。
以下是Google I/O 2025公布的重磅内容:
Gemini Ultra
Gemini Ultra(目前仅限美国)提供对谷歌AI应用与服务“最高级别的访问权限”,月费为249.99美元。套餐内含Veo 3视频生成器、新推出的视频剪辑工具Flow,以及尚未上线的强大AI功能Gemini 2.5 Pro的Deep Think模式。
订阅Gemini Ultra的用户还将获得更高配额的NotebookLM与图像混合应用Whisk,以及在Chrome中使用Gemini聊天机器人、基于Project Mariner技术的多项“智能代理”工具、YouTube Premium和Google Drive、Photos、Gmail的30TB存储空间。
Gemini 2.5 Pro的Deep Think模式
Deep Think是Gemini 2.5 Pro模型的一种“增强型推理模式”,可在回答前综合多个答案,提高模型在某些基准测试中的表现。
谷歌尚未详细介绍其具体原理,但其可能类似于OpenAI的o1-pro或即将推出的o3-pro,具备搜索和整合最佳解决方案的能力。
Deep Think目前通过Gemini API向“受信测试者”开放。谷歌表示将在更广泛推出前进行额外的安全评估。
Veo 3视频生成AI
谷歌称,Veo 3可生成音效、背景噪音,甚至是配音对白。画质方面也优于前代Veo 2。
Veo 3将从周二起上线Gemini聊天机器人应用,仅向Gemini Ultra订阅用户开放,可通过文字或图像提示生成视频内容。
Imagen 4图像生成AI
Imagen 4的速度比Imagen 3更快,未来还将发布比Imagen 3快十倍的版本。它能够生成布料、水珠、动物毛发等“精细细节”,支持写实与抽象风格,图像可达2K分辨率,多种尺寸比例。
Veo 3和Imagen 4都将为视频创作工具Flow提供核心支持。
Gemini应用更新
谷歌宣布Gemini系列应用月活跃用户数突破4亿。
Gemini Live将在本周向所有iOS和安卓用户开放摄像头与屏幕共享功能,借助Project Astra技术,用户可以与AI实现近实时语音互动,并实时共享手机画面。
未来数周,Gemini Live还将与谷歌生态其他应用深入整合,例如调用Google地图导航、创建日历事件、管理任务清单等。
此外,Deep Research功能升级,用户现在可上传私有PDF和图片生成研究报告。
Stitch
Stitch是一款AI工具,可用于设计网页和移动应用前端,用户只需几句话或一张图片,即可生成UI元素及HTML和CSS代码。
尽管Stitch的功能较部分“可视化编程”工具略有限制,但它提供了较高的自定义空间。
同时,谷歌扩大了开发者AI助手Jules的使用范围,Jules能帮助理解复杂代码、在GitHub上创建Pull Request、处理代码积压任务等。
Project Mariner
Project Mariner是谷歌的实验性AI代理,可代用户访问和操作网页。其现已更新,支持同时处理近十项任务,开始面向部分用户开放。
例如,用户无需打开第三方网站,只需与AI聊天即可完成购票或在线购物等任务。
Project Astra
Project Astra是由Google DeepMind推出的低延迟多模态AI项目,将为搜索、Gemini应用及第三方产品提供支持。谷歌也正与三星、Warby Parker等公司合作开发Project Astra眼镜,但尚未公布发布日期。
AI Mode
谷歌正在美国推出AI Mode —— 一种实验性的搜索功能,支持用户通过AI接口提出复杂的多段式问题。
AI Mode能处理涉及体育与金融的复杂数据查询,还提供服饰“试穿”功能。今夏晚些时候上线的Search Live将结合手机摄像头的实时画面支持基于视觉的搜索提问。
Gmail是首款支持个性化语境处理的应用。
Beam 3D视频会议
Beam(原名Starline)结合六摄像头阵列与定制光场显示器,让远程会议仿若面对面。其AI模型将不同角度的视频流合成为3D渲染图像。
Beam实现毫米级头部追踪与60帧/秒的视频流传输,结合Google Meet使用时,还可提供AI实时语音翻译,并保留原说话人的音色、语调与表情。
Google Meet本身也将支持实时语音翻译功能。
更多AI更新
Gemini将整合进Chrome浏览器,作为全新AI浏览助手,帮助用户快速理解页面内容并完成任务。
Gemma 3n是为手机、笔记本、平板优化的AI模型,周二起开启预览,支持音频、文本、图像与视频处理。
谷歌还为Gmail、Docs和Vids带来大量AI办公更新。Gmail将新增个性化智能回复与收件箱清理功能,Vids增强了内容创建与编辑功能。
NotebookLM将新增视频概览功能,同时谷歌上线了SynthID Detector —— 一个基于SynthID水印技术的AI内容识别平台。音乐生成模型Lyria RealTime也将通过API开放使用。
Wear OS 6
Wear OS 6引入统一字体,提升界面一致性;Pixel Watch将支持主题色同步,增强动态美感。
新设计平台将帮助开发者构建更丰富的个性化应用,并实现无缝的界面过渡。谷歌将提供开发者设计指南及Figma模板文件。
Google Play
谷歌为安卓开发者在Play商店新增多项工具,包括订阅管理、内容预览(如音频片段)、更流畅的支付流程等。
美国用户可访问“主题浏览”页面,快速发现与影视作品相关的应用。开发者还将获得专属的测试与发布页面及应用发布监控工具。遇到严重问题时,开发者可暂停应用发布。
订阅工具也获升级,支持多产品结账。开发者可在主订阅下销售附加服务,实现统一结账。
安卓Studio
安卓Studio将集成多项新AI功能,包括配合Gemini 2.5 Pro的“Journeys”(AI开发代理流程)与“Agent Mode”自动化开发功能。
此外,App Quality Insights面板的“崩溃洞察”功能也将由Gemini提供支持,帮助分析源码、定位崩溃原因并提供修复建议。
(责任编辑:风向标)
-
5、为什么搜索竞价的安装次数与第三方工具显示的安装次数不一样 这可能是苹果生成的安装下载报告与第三方工具报告存在安装时间上的统计差异,为保证更明确的了解具体数据,建议ASM可以联系第三方工具咨询...[详细]
-
彼此之间没有太多的利益纠纷,大家都是一条心地埋头做事,无怨无悔。...[详细]
-
张旭豪怎么做复盘? 张旭豪:我不断在想,我不觉得我过去做的哪些决定是特别正确,也不觉得哪些决定是特别错误。...[详细]
-
我们做过一个抽样统计,如果传统纸媒要做一个发行,他的成本有70%左右会花在发行渠道和印刷上面,剩下来的钱还要承担一个编辑团队的成本,到最后传统纸媒拿到超过10%的净利率是比较难的。...[详细]
-
“那时还是太年轻没经验,甚至不知道有投资人这回事。...[详细]
-
从经济学来说,30%的几率挣到300万,和3%的几率挣到3000万,和0.3%的几率挣到3亿,是一样的。...[详细]
-
但是2014年留给雷军的不只是遗憾,自主研发的松果处理器让小米成为了第四家可以自研芯片的手机厂商,这个项目立项是在2013年年底。...[详细]
-
只有成为媒体,才有基于该基础往别的方向发展可能性。...[详细]
-
第四,公司方是如何配合的,会不会配合老股东转让?首先从公司方看一看,作为公司方,他应该可以理解,投资人进来是为了博取以后的投资收益,没有一个投资机构会和公司一直走下去,总是会有退出的时候。...[详细]
-
说完了谁会买,那么我们应该从哪里找这些买家呢?我是不是可以找一些我以前的哥们、投资机构的熟人接手?的确,转让时找熟人接手可以,这里面有利有弊。...[详细]