您现在的位置是:b体育在线登录网页版 > 金融实况金融实况
迄今“最强大”、碾压gpt4……谷歌ai大模型问世,马斯克也点赞!股价大涨-b体育在线登录网页版
clz123 2023-12-14 【金融实况】 99804人已围观
当地时间12月6日,美国科技公司谷歌推出了gemini大模型。与大语言模型chatgpt不同,gemini大模型是原生多模态大模型,不仅可以处理文本内容,还可以无缝丝滑地处理代码、音频、图像和视频等多种模态的信息。据介绍,这是谷歌目前规模最大、能力最强的大模型。
gemini大模型一经推出,便引发了科技圈的“地震”,业内多名人士都对gemini大模型表达了祝贺与赞美。根据谷歌给出的基准测试结果,gemini大模型在大部分测试当中都打败了openai的chatgpt4,显示了先进的性能。
今日美股盘前,谷歌a、谷歌c均大幅上涨,一度涨约4%。开盘后,谷歌股价保持高位,截至发稿,谷歌a涨4.88%,谷歌c涨超5%。
主打“原生多模态”,30项测试结果超越gpt4
“gemini 是我们迄今为止最强大、最通用的模型,它在许多领先的基准测试中都展现出了最先进的性能。”在gemini大模型发布的公开信中,谷歌ceo桑达尔・皮查伊如此说道。谷歌deepmind的ceo和联合创始人德米斯・哈萨比斯代表团队对gemini大模型进行了详细介绍。
综合来看,谷歌此次发布的gemini大模型主要有以下几个亮点:
三个版本:提供三种不同的尺寸,实现从云上到手机、平板都可以运行。据谷歌介绍,尺寸由大至小分别为gemini ultra(规模最大且功能最强大,适用于高度复杂的任务)、gemini pro(适用于各种任务的最佳模型)和gemini nano(端侧设备上最高效的模型)。
多种模态:据介绍,gemini大模型从一开始就被创建为多模态的模型,这意味着它可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。
性能卓越:性能测试方面,在32项性能基准测试中的30项上,gemini ultra模型超越了现有最先进的gpt4。其中,在mmlu(大规模多任务语言理解)测试中,gemini ultra以90.0%的成绩首次超过了人类专家。
具备更强的理解、推理和编码能力:可以在海量的数据中发掘难以辨别的知识内容;尤其擅长解释数学和物理等复杂科目中的推理;可以理解、解释和生成世界上最流行的编程语言(如 python、java、c 和 go)的高质量代码,能够跨语言工作并对复杂信息进行推理,这些能力使其成为世界领先的编码基础模型之一。
以上这些亮点中,多模态信息识别、理解与处理能力无疑是谷歌gemini大模型最令人感到惊艳的一个能力。在一个测评视频中,测评人让gemini看一系列的影像,并要求gemini推理所看到的内容。记者看到,当测评人绘制一幅图片的时候,gemini可以实时描述它所“看”到的画面。更奇妙的是,当测评人展示两张斜坡上的车辆图片,问“从设计上看,哪个车会跑得更快?”时,gemini会问答:“右边的车更快,它更符合空气动力学。”
gemini大模型卓越的性能引得科技圈人士纷纷点赞。比如,特斯拉ceo埃隆・马斯克在桑达尔・皮查伊在社交平台x上的发布帖下评论称:“令人印象深刻。”除此以外,马斯克还对谷歌deepmind的ceo、gemini团队代表德米斯・哈萨比斯表示了祝贺。
ai进入多模态时代,带动算力赛道持续繁荣
一名人工智能研发人员向记者表示,谷歌gemini模型的核心优势在于其原生多模态的特性。具体而言,以往的多模态大模型是通过针对不同模态训练单独的组件,然后把这些组件组合起来,模拟多模态功能。虽然在单独和具体的任务上表现良好,但在处理需要更深层次概念理解和复杂推理的任务时,表现往往不尽人意。
“不像openai那样为图像和语音训练独立的dall-e和whisper模型,谷歌从一开始就构建了一个多感官模型。”该研发人员表示。
近期,以语音、图片、视频等为主要代表的多模态大模型站上风口。记者梳理发现,多家国内外科技公司密集发布了相关产品。
语音方面,11月22日,metab体育在线登录网页版官网发出公告,推出了一款多语言和多任务模型seamlessm4t,可用于无缝翻译和转录语音和文本。据悉,seamlessm4t的主要能力包括自动识别近百种语言的语音、语音翻译、文本转语音翻译等。
图像及视频方面,11月16日,metab体育在线登录网页版官网发布文生视频模型emu video和图像编辑模型emu edit。11月29日,美国初创公司pika labs发布了文生视频工具pika1.0,支持对视频进行实时编辑和修改;12月5日,美图发布ai视觉大模型miraclevision的4.0版本,新增ai设计与ai视频两大能力。其中,ai设计具备四大功能,包括矢量图形、文字特效、智能分层和智能排版,可以满足ai设计的基础需求。
业内人士普遍认为,多模态是生成式ai下一步的重点方向,百花齐放的应用场景有待继续探索。东方证券(600958)研报认为,现阶段大语言模型的竞争已经非常激烈,从技术突破的角度来看,下一阶段的重点攻克方向必然是多模态技术。能够真正处理和应用好多模态ai能力,才能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互。
中信证券研报指出,随着谷歌gemini模型发布,ai进入多模态时代。短期来看,gemini的发布将进一步激发市场对多模态模型的期待,对产业而言,多模态料将带动算力需求的提升;而在中长期来看,预计多模态模型的升级将丰富相关产品的使用场景,叠加硬件升级、算法优化带来的成本优化,2c产品的进展值得期待。持续看好本轮生成式ai浪潮对科技产业的长周期影响和改变,继续关注算力、算法、数据、应用等环节的领先厂商。
不过,相比于大语言模型,多模态大模型对算力的消耗呈指数级增长趋势。国泰君安(601211)研报认为:当前多模态大模型仍在不断迭代,训练阶段的算力将保持增长。根据测算,gpt4对于算力的需求在同等训练时长下相比gpt3增长445倍。训练成本持续高企,算力租赁商业模式具备可行性,短期持续看好算力以及算力租赁赛道。
责编:万健�
校对:彭其华
相关文章
- 京剧币登场,6000万枚秒光,二级市场价格上涨超6成!币商:不敢囤,赔怕了
- 中国工程院院士邬贺铨:2024年中国5g用户占比将超五成 5g-a的出现不会取代现有5g网络
- oled加速渗透中大尺寸市场 国内厂商出货量快速提升
- “容时容差”有益银行精细服务
- oppo申请相机系统专利,该专利技术能生成和输出组合后的图像信号
- 弘讯科技: 根据信息披露公平性原则,公司在各期定期报告中披露对应时点的股东信息
- 速派 全部在售 2024款 2023款 2022款 2021款 2019款 2018款
- 博众精工(688097):博众精工科技股份有限公司董事会议事规则
- 链博会小词典丨150秒带你看懂智能汽车链
- 华为系首款轿车开卖,余承东:赶紧买,明年可能要涨价
猜你喜欢
-
纽约时报起诉微软和openai侵权:擅用报道训练大模型 损失数十亿美元
行业头条《纽约时报》指控微软和openai侵犯b体育在线登录网页版的版权,违规使用其文章训练chatgpt等ai(人工智能)聊天机器人。 当地时间12月27日,《纽约时报》以侵犯b体育在线登录网页版的版权为由起诉openai和微软,成为了第一家起诉这两家公司侵犯其文字作品b体育在线登录网页版的版权的美国大型媒体...
阅读更多 -
ai相关收入持续稳健增长!商汤科技荣获金融界第十二届“金智奖”杰出前沿科技企业称号
金融实况“启航2023金融强国论坛”于12月22日在北京石景山区银保国际会议中心顺利召开,主题聚焦“创新开放,共享机遇”,来自政府、机构、企业、媒体的数百位精英齐聚一堂。在会上,备受关注的第十二届“金智奖”年度评选榜单揭晓,商汤科技凭借在科技研发领域的持续投入,荣获“...
阅读更多 -
总决赛结果揭晓 分享课 | 2023第六届上海交大-卫宁健康智慧医疗挑战赛圆满结束
金融市场11月25日,2023第六届上海交大-卫宁健康智慧医疗挑战赛全国总决赛圆满举办。经过近半年的筛选与角逐,最终19支优秀团队脱颖而出,进入总决赛。上海理工大学的相队和来自上海交通大学的0x73b队分别摘得高校组和综合组桂冠。 上海交大-卫宁健康智慧医疗挑战赛至今...
阅读更多 -
申昊科技:与科大讯飞签署框架合作协议 强强联合推动ai大模型赋能机器人
经济时评12月9日,杭州申昊科技股份有限公司(证券代码:300853.sz,证券简称:申昊科技)与科大讯飞股份有限公司在杭州签署了框架合作协议。双方将充分发挥各自的优势和资源,推动大模型与工业机器人的应用落地,深度绑定推动声学产品在电力市场拓展,全面推动在水电水利、矿...
阅读更多 -
生益电子: 公司汽车高端数据处理pcb产品主要涉及智慧驾驶用车载服务器产品
保险理财投资者:调研1:又过一年了,本次针对单一产品进行咨询,首先请董秘根据最新经营情况更新下答投资者问题的模板,在新能源汽车智能网联化(无人驾驶领域),贵司当下激光雷达,4d毫米波雷达的单产品销量怎么样?有供应哪些车企或车型,再根据市场,后期销量也请展望下,谢谢....
阅读更多