在本周的谷歌年度开发者大会I/O上,谷歌宣布了双子座家庭的新成员——Gemini 1.5 Flash,一款专为速度和效率优化的新型人工智能模型。该模型不仅扩展了谷歌在人工智能领域的边界,还进一步满足了开发人员对更轻、更便宜但功能强大的AI机型的需求。
谷歌DeepMind首席执行官戴密斯·哈萨比斯在报告中指出,Gemini 1.5 Flash在多个领域表现出色,包括摘要生成、聊天应用、图像和视频字幕制作,以及从长文档和表格中提取数据等。这款新型AI模型之所以能够在保持功能强大的同时实现轻量级设计,得益于一种名为“蒸馏”的过程,该过程将Gemini 1.5 Pro中最重要的知识和技能转移到较小的模型中。
尽管Gemini 1.5 Flash的重量较轻,但它却拥有与Pro版相同的多模态功能,包括一个能够处理100万个令牌的长上下文窗口。这一能力使得该模型能够一次性分析高达1500页的文档或超过30000行的代码库,为开发人员提供了前所未有的便利。
值得注意的是,Gemini 1.5 Flash并非面向普通消费者,而是专为开发人员设计。通过使用谷歌的技术,开发人员能够更快速、更经济地构建自己的人工智能产品和服务。
此外,谷歌还对Gemini 1.5 Pro进行了升级,增强了模型编写代码、推理以及解析音频和图像的能力。更令人兴奋的是,谷歌计划在今年晚些时候将现有模型的上下文窗口增加一倍,达到惊人的200万个令牌。这将使模型能够同时处理长达2小时的视频、22小时的音频、6万多行代码或超过140万个单词的内容。
目前,Gemini 1.5 Flash和Pro版本均已在谷歌的AI Studio和Vertex AI中提供公开预览。同时,谷歌还发布了Gemma open模型的新版本——Gemma 2。然而,这些更新主要面向开发人员和对构建AI应用感兴趣的用户,对于普通消费者来说,这些功能可能并不直接相关。
随着Gemini 1.5 Flash的发布,谷歌再次展示了其在人工智能领域的创新实力,并为开发人员提供了更多强大而灵活的工具来构建未来的人工智能产品和服务。