开源日报 | 苹果质疑LLM无法进行逻辑推理;90后AI天才造卡车;Python 3.13性能测试;关于AI与芯片;谁该为IBM的没落负责?

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.10.15

今日要闻

Python 3.12 vs Python 3.13 – 性能测试

测试的第一部分使用一台配备 AMD Ryzen 9 7900 处理器、DDR5 内存和 M.2 PCIe Gen4 NVMe 驱动器的台式电脑。

结果显示,Python 3.13 在以下测试中比 Python 3.12 有最佳性能结果:async_tree_eager_io_tg(快 1.61 倍),async_tree_eager_io(快 1.54 倍),async_tree_io_tg(快 1.54 倍)。然而,你可能会注意到一些测试的性能下降,特别是在 coverage(慢 1.36 倍),create_gc_cycles(慢 1.13 倍),regex_v8(慢 1.13 倍)。

Layui 发布 2.9.18 稳定版本

Layui 是一套遵循原生态开发模式的 Web UI 组件库,易上手,可以更简单快速地构建网页界面。

智谱开源新一代文生图模型 CogView3-Plus

智谱宣布开源文生图模型 CogView3 及 CogView3-Plus-3B。CogView3 以及 CogView3-Plus 模型均使用 Apache 2.0 协议,目前该系列模型的能力已上线「智谱清言」(chatglm.cn)。CogView3-Plus-3B 的效果:


今日观察

社交观察

包云岗老师的开源处理器项目非常值得关注

眼下互联网开源项目里,包云岗老师的开源处理器项目非常值得关注。因为计算的软硬件边界正在变得模糊,传统纯软产品(指以软件作为商品的商业化模型)将不复存在,而硬件的门槛在持续降低。今天创业的年轻人们,10年以后如果你们事业有小成,都会考虑用芯片级设计来保护自己的知识产权,提升产品性能功耗,降低成本,构筑竞争优势,而做一颗简单芯片的成本会显著低于一套房产的价格。这时候你就会发现包老师的这个项目全套设计、工具链、验证、社区都已经成熟。你就可以选择卖一套郊区的房子创业了。

- 微博 有个梨GPT

一块3090打造本地实时AI语音

该项目基于Meta论文改进,采用音频与文本的多模态融合模型实现,具体分为三个阶段:

1. 多语言预训练:使用7种语言数据集和最新的语音模型,进行了8064步的训练。

2. 性能和场景平衡:将数据量从92万增加到189万,涵盖日常对话、问题解决和数学等多样主题,进行7400步训练。

3. 微调“无法听见”:针对无法听清的输入和多轮对话进行微调,使用513个WhisperSpeech声音标记,完成644步训练。

Github:https://github.com/homebrewltd/ichigo

- 微博 量子位

苹果发文质疑:大语言模型根本无法进行逻辑推理

来自苹果公司的 Iman Mirzadeh 及其研究团队提出了一个名为 GSM-Symbolic 的新基准,针对多个开源模型(如 Llama、Phi、Gemma、Mistral)和闭源模型(如 GPT-4o、o1 系列)进行了大规模评估。

结果显示,当问题中的数值或名字变化时,模型的会表现出显著的波动。此外,随着问题难度的提升(如增加更多子句),模型的表现迅速下降,这表明这些模型在推理复杂问题时非常脆弱。

研究团队认为,这种表现下降并非偶然,而是因为当前的大语言模型缺乏真正的逻辑推理能力,更多是在基于训练数据中的模式进行匹配,而非像人类一样进行符号和逻辑推导。

即使是简单的变化,如调整问题中的数值,也能导致模型准确率下降 10%。而当问题增加一个额外但无关的子句时,性能下降幅度甚至高达 65%。

- 微信 学术头条

马斯克SpaceX星舰的设计目的是将现有系统改进1000倍

前天星舰的第五次试飞,成了一次全球观礼,影响力远超过较早的汽车机器人(和擎天柱),看来人类还是骨子里向往星辰大海。
发射后,X上一些网友围绕发射视频做持续讨论,其中一名叫“Whole Mars”的网友转发了一张图(图一),内容是SpaceX这些年如何降低了太空发射成本,这也引起了马斯克的关注,并给予长篇回复。
我觉得其中有一点马斯克讲得很好,他讲了一个剪刀差问题:一方面,要想让人类去往火星,实现太空生存,那么就需要运载大量物资,但是另外一方面,传统的运营方式(比如波音的系统),随着技术的发展,不但成本没有下降,还在继续上升。所以一定难以为继。
因此,SpaceX的目的就是减少这个剪刀差,把系统做到一千倍的改进。

- 微博 高飞

关于AI与芯片的文章

这是另一篇关于AI与芯片的文章,简要梳理了过去20年AI与处理器芯片发展历程。

全文链接:https://www.zhihu.com/question/827235247/answer/5133519791

- 微博 包云岗

全国 354 家上市的软件公司,2024 年上半年收入加到一起是 2988.86 亿元

全国 354 家上市的软件公司,2024 年上半年收入加到一起是 2988.86 亿元,利润加到一起是 6.9 亿元。算一下总利润率就是 0.23%。 ​​​
 

- 微博 t0mbkeeper

媒体观察

李飞飞与她创造的新独角兽

如今,Geoffrey Hinton对AI的研究已经得到诺贝尔物理学奖的承认,那么我们有理由期待,在未来几年内,李飞飞也可能会与这个全球最重要的科学奖项发生更直接的联系。

- 蓝鲸财经

深入实用环节,AI如何让剧本“活起来”?|对话猫眼神笔马良项目技术负责人张蒙

不同于能在视频成果中 “一目了然”的AI产品,神笔马良的定位暂时没有面向最终影视视频的生成,而是面向影视创作的中间过程,生成和传递关键信息,辅助后续创作。这或许是影视行业拥抱AI的必经之路——让AI不再只是噱头,能为行业提效带来实际可应用的价值,这也同样是AI产品商业化的可能性所在。

- 深响

海外小作文袭扰AI信仰?GPU泡沫论甚嚣尘上 真相是……

必须承认的是,“AI泡沫”论的警钟敲了又敲,“AI投资回报难达预期”的质疑声音一浪高过一浪,一边是OpenAI抱怨算力上线不及时不够用、英伟达新品售罄,另一边是算力租赁价格不断下降、还有公司“甩卖”GPU。

但局部、短期的算力过剩或短缺,似乎已难以代表AI的全盘局面,对于供需两方、多空两边来回博弈的AI领域来说,在硬件端之外,或许亟待更多新故事。

- 科创板日报

谁该为IBM的没落负责?

问题不仅仅在于错失一次机会。更重要的是:它为什么会一错再错?在关键节点上,IBM看起来每次都赌错了方向。这绝不仅仅是运气差那么简单,而是战略与执行的双重失误,以及公司文化的内在问题。

- 数智猿

黄仁勋最新万字访谈:AGI即将来临,AI将彻底改变生产力

黄仁勋强调了AI技术的迅速演变,尤其是通向通用人工智能(AGI)道路上的突破。他表示,AGI助理即将以某种形式出现,并且会随着时间的推移变得更加完善。

- 华尔街见闻

90后AI天才造卡车,靠端到端进自动驾驶第一梯队

作为全球无人车第一股图森未来的联合创始人,他完整参与了一次决策式AI驱动的自动驾驶从0到1,缔造了全球自动驾驶第一股,而且作为计算机名校CMU的高材生,再出发没有首选软件方向,出乎不少人意料之外。

- 智能车参考


今日推荐

开源项目

graphql-editor/graphql-editor

https://github.com/graphql-editor/graphql-editor

Graphql editor 是一款 Graphql 的可视化编辑器和 IDE,帮助用户更容易理解 GraphQL 模式,通过使用可视化块系统创建模式。GraphQL Editor 将把它们转化为代码。通过 GraphQL Editor,用户可以在不写任何代码的情况下创建可视化的图表,或者以一种很好的方式呈现其模式。

每日一博

全域用户建模在美团首页推荐的探索与实践

本文详述了全域建模技术在美团首页推荐系统的发展和演进。美团首页推荐算法团队通过多阶段递进式探索验证,在召回与排序模块引入多展位、多应用渠道的多源用户交互数据,并在落地过程中解决了美团多展位、多业务、时空场景强相关性的特点导致的严重跨域信号负迁移挑战。

图2. 外卖和门票业务在首页推荐的点击量级随星期和小时的变化


开源之声

用户观点

影视飓风那个视频全网下架!还得看看开发者来讲讲视频平台整体技术

  • 观点 1:我觉得跳出技术的层面,从全流程来看,问题根源在于国内视频网站盈利模式不健康,在与运营商谈判流量价格时底气不足、客观成本居高不下,形成一种恶性循环
  • 观点 2:经典的解决不了问题就解决提出问题的人
  • 观点 3:ytb清晰度高,背后的Google自身就是运营商,流量成本有优势,国内很难的啦
    • 观点 4:还有先发优势,可以用用户使用体验来胁迫其它国家运营商对流量结算进行压价。
  • 观点 5:问题就出在视频平台欺骗消费者,你提供不了就提供不了,可以涨价或者直接不提供高清高码率,但你不能用假高清来糊弄人,所以这就是视频平台的锅,没得洗。
  • 观点 6:自导自演,去b站上搜一下一堆讲这个问题的,就他被下架,还利益相关,他说了又怎样,太看得起自己了。
  • 观点 7:绝大多数大众不需要懂技术就是要态度,不管怎么改偷偷改肯定会被骂,骂了不发个解释还控制舆论更加被骂,国内公关逻辑就是高人一等的态度,韭菜们无需解释,被骂就是该
  • 观点 8:绕来绕去最终就是围着码率转
    • 观点 9:看事情别那么单一,还有帧率,分辨率
  • 观点 10:文章后面提到的很好啊。既然创作者与用户都是对视频格式或观影体验有很高要求,为何不自己搭建新平台,专门播放极高要求的视频流。
    • 观点 11:一个月小花个几万流量费和带宽费是吧
  • 观点 12:B站未来有可能倒闭,但绝不会变质
  • 观点 13:有时候这玩意就不是技术问题,又不让用pcdn嫌弃质量差,又不让放广告嫌弃影响体验,又不让开通各类打赏盈利方式嫌变质,问就是我开了20块钱的会员我贡献了,不服你自己涨价。特么的ugc平台倒了,那些作者的视频你替我缓存?YouTube背靠谷歌这个网络运营商,在国外商宽更便宜的前提下,在各地搭建数据中心,视频里包含贴片广告,开头广告,中间广告,结尾广告,视频作者口播广告,视频作者会员,YouTubepremium9.99刀一个月,各类版权的情况下,盈利。这种问题问到最后就会变成质疑三大运营商和电信专营,b站比优爱腾三个货已经好上不少了。我唯一的建议是推广720p60,而不是搞花里胡哨的低码率4k
  • 观点 14:现在的CDN很智能,检测到直播视频流,可能会进行优化处理后在CDN加速
    • 观点 15:平台一般会确认画质是不是在CDN那被改了的,CDN也不会投入太多钱去搞这个算力,亏钱的
  • 观点 16:p2p模式势在必行?
    • 观点 17:pcdn的结果是用户上传带宽进一步被砍,没什么球用

为什么hao123渐渐淡出人们的视线了?

  • 观点 1:小时候hao123下面43997k7k的网址可迷死我了
  • 观点 2:因为那时候网吧电脑,首页基本都是hao123
  • 观点 3:某个阶段占领了用户心智,先发优势
  • 观点 4:都成天抖音了还用啥
  • 观点 5:败家老爷们,不愧现在垫底
  • 观点 6:hao123 可是我记住的第一个网站
  • 观点 7:我用互联网档案馆把2007年的hao123下载到本地。将其设为主页。怀念那段时光。
  • 观点 8:因为现在移动端成了主力
  • 观点 9:20年前就有搜狗搜索了?
  • 观点 10:PC 时代的产物
  • 观点 11:一时没看懂愣了一下,再看标题才回过神来
  • 观点 12:刚接触电脑字都不会打,有导航网站当然是点点点,现在嘛手机下载各种app就满足需求了
  • 观点 13:想起小时候装盗版游戏最讨厌首页被改成hao123,还曾经用QQ管家锁过主页为Google。
  • 观点 14:勾起了小时候一打开浏览器就输123的记忆
  • 观点 15:我最早是用5566.net
  • 观点 16:用那个当首页不超过一个月,没咋用过,我喜欢用浏览器书签

---END---