欢迎光临北京软件和信息服务业协会官方网站
AI NEWS| GPT-4o深夜炸场;AI+医疗落地看病体验升级;字节跳动发布豆包大模型;Google发布AI全家桶
发布日期:2024-05-22    来源:HCR慧辰股份    分享到:

近年来,人工智能的发展正在呈现出井喷式增长趋势,也将成为颠覆未来内容创作与商业运营模式的存在。为帮助行业了解AI最新趋势与动态,HCR慧辰股份推出“AI News:大模型新闻周览”栏目,帮助整理包括大模型应用、AI前沿技术创新、人工智能与经济社会发展的深度融合等海内外大模型相关资讯。作为一个致力于推动人工智能领域进步的平台,我们将为您提供有洞察力和价值的新闻内容。让我们一起探索AI未来,共同迈向数智时代的精彩旅程!


日前,国家互联网信息办公室(以下简称“国家网信办”)发布第五批深度合成服务算法备案信息的公告。HCR慧辰股份研发的AIGC语音大模型生成算法—“慧辰语音合成算法”,继文本类大模型 “慧辰大模型内容生成算法”之后,也成功通过国家网信办算法备案。

1716347935925.jpg

GPT-4o报道


GPT-4o深夜炸场!AI实时视频通话丝滑如人类!

OpenAl在5月14日凌晨发布了其最新的旗舰AI模型GPT-4o,该模型标志着AI技术的一个重要里程碑,并计划推出PC桌面版ChatGPT。GPT-4o中的“o”代表“Omni(全能模型)”,它能够在音频、视觉和文本领域进行实时推理,响应音频输入的速度惊人,最快仅需232毫秒,与人类对话的节奏同步。与前代GPT-4-turbo相比,GPT-4o在API使用上价格减半,速度提升两倍。(中华网)


谷歌2小时疯狂复仇,终极杀器硬刚GPT-4o!Gemini颠覆搜索,视频AI震破Sora

被OpenAI提前截胡的谷歌,已不甘示弱开启反击!大杀器Project Astra效果不输GPT-4o,文生视频模型Veo硬刚Sora,用AI彻底颠覆谷歌搜索,Gemini 1.5 Pro达到200万token上下文……谷歌轰出一连串武器,对OpenAI贴脸开大。谷歌I/O 2024如期来了,眼花缭乱地发布了一堆更新。(新智元)


OpenAI发布新模型GPT-4o 音频视觉文本实现“大一统”

OpenAI 首席技术官穆里·穆拉蒂表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。可以综合利用语音、文本和视觉信息进行推理。此外,GPT-4o 的运行速度将大大提升,最大亮点在于其语音交互模式采用了新技术OpenAI 一直致力于让用户通过语音与 ChatGPT 进行交流,仿佛与真人对话一般。然而,之前的版本由于延迟问题,严重影响了对话的沉浸感。GPT-4o 则采用了全新的技术,让聊天机器人对话的响应速度大幅提升。(中国经营网)


GPT-4o发力端侧应用,OpenAI更在乎情绪价值

GPT-4o在性能和效率方面进行了显著优化。得益于改进的模型架构和训练方法,GPT-4o在处理复杂任务时展现出更高的准确性和更快的响应速度。OpenAI表示,GPT-4o的推出将为用户带来前所未有的体验,显著提升自然语言处理、对话系统、数据分析和编程辅助等领域的应用效果。(钛媒体)


Google发布“AI全家桶”,强力回击GPT-4o

在OpenAI推出能够实现人类级别响应的智能助手GPT-4o后,谷歌的AI智能体项目Project Astra也重磅登场。在演示视频中,Astra能够通过手机摄像头或智能眼镜看到的内容来分析响应语音命令。它成功地识别出代码序列、为电路图提出改进建议、能够通过镜头“看到”伦敦国王十字区,并提醒用户智能眼镜的放置位置。(福布斯资讯号)


行业聚焦


创新应用活跃 上市公司加快布局多模态大模型

5月14日,随着OpenAI宣布GPT升级,A股市场多模态大模型板块应声上涨。中国证券报记者注意到,A股上市公司在多模态大模型领域加大创新应用,并以行业应用为导向,加快大模型在自动驾驶、金融服务、文化创意等诸多产业领域应用落地。(中国网)


“AI+医疗”落地 看病体验升级

利用一款软件加一个麦克风,医生只需按常规方式对患者进行问诊,系统就能精准抓取和理解医患对话中的关键信息,帮助医生在电脑上自动生成门诊电子病历,提升诊疗效率。在大模型浪潮下,这种场景只是医疗领域人工智能加速发展的一个缩影。(中国经济网)


创新应用活跃 上市公司加快布局多模态大模型

日前,随着OpenAI宣布GPT升级,A股市场多模态大模型板块应声上涨。中国证券报记者注意到,A股上市公司在多模态大模型领域加大创新应用,并以行业应用为导向,加快大模型在自动驾驶、金融服务、文化创意等诸多产业领域应用落地。(中国网)


AI手机竞争升级 厂商角逐多模态大模型

随着AI的快速渗透,智能手机市场正迎来一场新的竞争。各大手机制造商纷纷瞄准生成式AI,积极探索多模态大模型,以期在竞争中拔得头筹。(中国经济网)


Wedbush预计2024年AI支出占企业IT预算10% AI革命2.0来临?

根据 Wedbush 对季度财务业绩的审查,到 2024 年,人工智能(AI)相关的支出将显著增长,占企业IT预算的8%至10%。这一预测突显了AI支出在2023年仅占IT预算不到1%之后的快速增长。(智通财经网)


杜绝代写、检测超40%发警示 多所高校规范大学生用AI写论文

2024年的高校毕业季即将到来,相比往年,今年不少国内高校先后发文,就学生如何在毕业论文中使用生成式AI、AI代写在论文中的比例等问题作出规范。有不少学生表示,他们在论文创作中会使用AI来搜集文献、处理数据、书写代码等。也有学生称,AI写出的内容有时会出现错误。(央广网)


中国!阿里云与微软、Meta 等共同制定下一代 AI 网络架构标准

5 月 15 日,阿里云成功入选超以太网联盟(UEC)技术咨询委员会,成为的中国公司成员,将与微软、Meta、AMD、博通等其他 12 名成员,共同推进开放网络系统及核心技术的研发及标准制定,打造下一代 AI 网络基础设施。UEC 联盟希望通过开源开放的技术合作促进创新,因此也被业界类比为网络领域的苹果系统与安卓生态。(IT之家)


企业动态


字节跳动发布豆包大模型 主力模型比行业价格低99.3%

5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎是字节跳动旗下云服务平台,据火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。(央广网)


中文原生DiT架构,腾讯混元文生图大模型开源

近日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。这是业内中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。(新华社)


vivo 自研蓝心大模型升级“自研 AI 多模态大模型”

在正在举行的 vivo 影像新蓝图暨 X 系列新品发布会上,vivo 宣布自研蓝心大模型升级「自研 AI 多模态大模型」,多模态技术让大模型从最原始的视觉、声音、空间等方面接触、感知、理解世界,让大模型更全面、更聪明、更强大。(IT之家)


华为政企部团队访问开普云交流AI大模型一体机    

据开普云官微,华为政企部领导及团队访问开普云,双方就AI大模型一体机、大模型安全风控等产品和业务进行了合作探讨。开普云展示了AI大模型一体机以及AI内容安全风控产品“鸠摩智”。(界面新闻)


华策影视自研“有风”大模型通过备案

近日,华策影视自研的“有风”大模型已按国家七部委联合发布的《生成式人工智能服务管理暂行办法》通过国家生成式人工智能服务名单备案。华策影视成为A股家拥有通过国家“生成式人工智能服务备案”自研大模型的影视公司。(财联社)


百度发布全球 L4 级自动驾驶大模型 Apollo ADFM,称比人类驾驶更安全

百度 Apollo 近期在武汉百度萝卜快跑汽车机器人智行谷举办 Apollo Day 2024,发布了全球支持 L4 级自动驾驶的大模型 Apollo ADFM(Autonomous Driving Foundation Model)。(IT之家)


国际视野


AI聊天机器人Grok今日起向欧洲X平台Premium会员开放

5月16日,社交平台X首席执行官琳达·亚卡里诺在个人账号宣布,Grok人工智能聊天机器人当天起向欧洲的X Premium会员开放服务。(界面新闻)


谷歌I/O开发者大会集合贴:足足喊了120次AI 实时交互、视频模型登场

从北京时间周三凌晨1点开始,谷歌在山景城总部附近的海岸线圆形剧场,召开了长达两个小时的年度I/O开发者大会Keynote演讲。在一大堆更新和新发布的功能中,有许多具有记忆点的产品。(科创板日报)


AI圈沸腾!巨头神秘新品来了,苹果“赢麻了”?

在半小时的线上发布会上,OpenAI的首席技术官米拉·穆拉蒂(Mira Murati)宣布GPT-4的一系列升级。发布会的主要亮点如下:推出了全新的模型GPT-4o,其中的“o”表示“omni”(全面、全能)。同时,GPT-4o 向所有用户免费开放。发布了ChatGPT 桌面应用程序,目前可适用于 macOS,Windows 版本将在今年晚些时候推出。(证券时报)


ChatGPT将变身AI语音助手?挑战Siri和谷歌语音助手

新品发布在即,奥特曼的最新表态或暗示OpenAI意在人工智能语音助手。当地时间5月11日,人工智能(AI)巨头OpenAI CEO山姆·奥特曼(Sam Altman)在一档播客节目中称,OpenAI将继续改进并提升ChatGPT的语音功能质量,并表示相信语音交互是通向未来交互方式的一个重要途径。(中国网)


微软(MSFT.US)将在法国投资40亿欧元 加码云计算+AI

微软(MSFT.US)周日表示,计划斥资40亿欧元(43亿美元)在法国建设云计算和人工智能(AI)基础设施,并在法国城市米卢斯建立一座数据中心。这一消息是在“选择法国”峰会前夕宣布的,该峰会的目的是吸引外国投资者到法国投资。(智通财经网)


Arm据称将开发AI芯片 计划在2025年秋季开始量产

据媒体报道,软银集团旗下的芯片设计公司Arm计划开发人工智能(AI)芯片,并力争在2025年推出首批产品。Arm将承担初期的开发成本,预计将达到数千亿日元,软银也将出资。一旦大规模生产系统建立起来,Arm的AI芯片业务可能会被剥离出来,并归入软银旗下。软银持有Arm公司90%的股份。(科创板日报)

你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.