小米补课大模型


来源:安博电竞网上官网登陆    发布时间:2023-10-23 22:50:29

  越想听小米轿车的意向,雷军越不说。憋到十月一号国庆假日这天,放了个大招——仍是关于大模型的。

  十月一日这天的音讯是,雷军出资了王小川的大模型公司百川智能。后者本年 3月建立,说要“构建我国最好的大模型底座”,还要在年末追平GPT-3.5。

  其最新的版别还通过了《生成式人工智能服务办理暂行办法》存案,正式上线面向大众供给服务,可以说在国产大模型范畴,百川的速度很快。

  当然雷军也不慢,这次出资百川智能归于A+轮,听说,之前一轮雷军也投了。在大模型上,雷军不只下手快,方针还多,别的两个闻名的国产大模型公司智普AI和minimax也得到了他的垂青。

  此外,小米还有自己的AI智能团队,研制人员比百川智能整个公司的人还多,而其发布的2023年Q2财报上说,研制费用达到了46亿。

  尽管,小米的高层曾表态:“小米不做通用大模型“,但无论是” 跑通端侧大模型“,仍是连续押注通用大模型公司,雷军的AI野心,着实不小。

  王小川领衔,团队里有不少搜狗的旧部,磨合起来反常顺畅,一些老职工甚至感觉:仅仅换了个当地工作。

  5月,百川智能就诞生了第一款大模型Baichuan-7B,然后一个月更新一次,到了9月,530亿参数的闭源Baichuan2-53B,渐渐的开端进军To B了。

  百川智能看起来一切顺畅,又有王小川这个金字招牌,融资也是顺水推舟,但国内的大模型商场本年以来长时间处于风口,一大群科技网络公司都挤在一同分一杯羹,百川人强马快,但实际并不是特别夸姣。

  我国科学技能信息研究所发布的《我国人工智能大模型地图研究报告》显现,截止到本年5月,国内现已发布了79个大模型——盘古、悟道、文心一言、通义千问、星火认知……还有一堆姓名古怪的模型,百川智能夹在里边,竞赛压力适当之大。

  其次,大模型这东西,一旦干起来就需求数不胜数的显卡芯片、算力和不断迭代的技能,这些都换算成钱,就一个字——烧。

  刚好雷军不只有钱,要害还懂技能,小米在大模型这一范畴,拥抱出一个手机上运转的模型,雷军尽管不做通用模型,但从独角兽到百川这样的实力派勇于探索商业模式的公司,给钱真是没有犹疑过。

  8月,雷军在舞台上喊出“小米全面拥抱大模型“后,就拿出了一款“端侧”的轻量大模型——“端侧”,是指模型服务不是布置在云端,而是直接存储在手机设备内部的芯片中,仅使用芯片的算力生成成果。

  本年5月份的谷歌I/O大会上,谷歌一口气发布了四个新一代大言语模型 PaLM 2。其间最小的“壁虎”大模型,可以适配手机运转。而 “壁虎”也被称誉为PaLM 2模型中 “最重要的亮点”——这与小米的端侧轻量化模型相辅相成。

  雷军明显知道,在大模型紊乱的战场上,端侧轻量化并适配手机的模型,另辟蹊径,却能为助推手机销量甚至小米高端化战略,翻开新的局势。

  小米高档副总裁、手机部总裁曾学忠也以为,AI和手机的端侧结合或许成为下一次跨过。AI让设备可以真实“了解”人,然后让人与设备更进一步结合。

  而另一方面,通用模型表面上没有被小米“拥抱”,实际上也不能少,究竟未来的小米轿车和其他硬件产品的人机对话、语义了解,都需求得到通用大模型来加持。

  现在苹果、华为、三星、OV、荣耀等简直一切头部厂商都先后宣告了落地,或即将落地大模型,小米依托自研+出资左右开弓的布局,要在其间杀出一条血路十分困难。

  可是关于小米来说,即使它并不想成为下一个OpenAI,也必须得投出下一个OpenAI。