admin
43208 帖子
《哪吒2》香港上映:有人给打5分,也有人打0.5分(组图)
img { height: 251.0460251046px;width:600px;}img { height: 327.86885245902px;width:600px;}img { height: 216.60649819495px;width:600px;}img { height: 206.89655172414px;width:600px;}img { height: 512.82051282051px;width:600px;}img { height: 1304.347826087px;width:600px;}img { height: 476.19047619048px;width:600px;}img { height:...
DeepSeek+华为,能不能超越英伟达和Open AI?(组图)
img { height: 937.5px;width:600px;}DeepSeek开源动作仍在持续,引发了AI圈又一轮震荡。2月21日12点,DeepSeek团队在X平台发布了一段英文内容。简单解释一下,其实说的就是:“从下周开始,我们将开源5个代码仓库,以完全透明的方式分享我们微小但真诚的进展。”紧接着在2月24日,DeepSeek就开源了首个代码库FlashMLA。用咱们得到App AI学习圈主理人快刀青衣老师的话说,能做出这样的行动,是非常有魄力的。他打了一个比方:之前开源的是工作成果,就像一个老师傅,把他所有的经验无私传授给你。而现在,你不但能拿到老师傅的秘籍,还能看到老师傅在过程中是怎么干活儿的。这对很多人来说,会比结果更有价值。当然,各国网友对DeepSeek这一动作都不乏赞美之辞,反响十分热烈。今天我们先不细究代码库FlashMLA的工作原理,而是想来聊一下,从DeepSeek R1发布以来许多人在思考的一个问题:真正具有“开源精神”的DeepSeek加上华为,能不能超越英伟达和Open AI?正好前不久,咱们得到的万维钢老师,在他的专栏里花大篇幅回答了这个问题。本文选自《万维钢·精英日课6》,文中万老师用更全面、更长远的视角,探讨了为什么AI需要越来越强的算力,以及中国为什么要突破芯片技术限制、坚持长期投入通用人工智能研发等问题。下面,请万维钢老师为你分享:作者:万维钢来源:《万维钢·精英日课6》01对算力的需求永无止境DeepSeek采用了一些巧妙的优化方法,能够用比较少的算力实现o1级别的功能,这非常了不起,这对中国——也对美国——的大模型研发者都是天大的好消息。但这绝不是说以后英伟达那种高级芯片就没用了,咱国产芯片就够用了。现在AI缩放定律远远没有看到尽头,更高的智能要求更高的算力这个根本原则并没有变。要知道就算没有DeepSeek,别家公司和科研团队,包括OpenAI自己,也在优化模型性能,再考虑到英伟达芯片升级,用山姆·奥特曼的话说就是“模型输出成本每年都会降低十倍”(即降至原来的十分之一)。假设DeepSeek突破之前那一刻,OpenAI用100的算力得到100的智能,DeepSeek突破了,大家用10的算力就能得到100的智能——但你的目标不是100的智能,而是一万、甚至一百万的智能,所以你仍然需要比目前高出百倍千倍的算力。所以对算力的需求目前来说还是无止境的。但英伟达并非高枕无忧,美国有好几家公司在做自己的AI芯片,中国也有包括华为、寒武纪、百度、壁仞科技等等正在追赶。那么国产AI芯片的水平相对于英伟达来说到底如何呢?国产最强的是华为昇腾。我让ChatGPT Deep Research调研并且制作了下面这张表格,把华为昇腾和英伟达近几年的主流GPU做了个对比——这个结果可以说是既不让人悲观,又不让人乐观。当前能用的最强国产GPU是2022年发布的华为昇腾910B,它的性能在某种意义上已经略微超过目前仍然被很多AI公司广泛使用的、英伟达2020年发布的A100。这很重要,这说明就算美国对中国搞全面断供,中国也能继续训练AI。但910B比英伟达目前的当家芯片,2023年发布的H200和24年发布的B100,就差距比较大了,算力大致相当于英伟达的二分之一到四分之一。华为2025年即将量产昇腾910C,基础算力与910B差不多,推理性能据说达到英伟达之前H100的60%。但英伟达2025年会推出GX200,算力预估是910C的五倍。02高级智能一定是通用智能为什么英伟达在继续突飞猛进,而华为有点接近极限的意思?这里最重要的原因就是光刻制程。英伟达A100和华为昇腾系列都是7纳米制程,在这个尺度上中芯国际能做。只是在910C这个级别要求N+2制程,中芯国际的良率据说很低,这意味着生产成本高。而英伟达H系列、B系列、GX系列分别是5纳米、4纳米、3纳米制程,中芯国际做不了。因为中国大陆没有极紫外光刻机。《精英日课》讲《芯片战争》一书的时候说过,极紫外光刻机极其不可能靠一个国家完全独立自主造出来,现在看至少未来十年之内可能性不大。所以当前最可行的办法,还是从英伟达买。那你说现在DeepSeek已经很好用,我们就在这个基础上提升性能行不行,何必非得追求最高的性能呢?我认为那是万万不行的。要知道DeepSeek是个相对比较小的模型,它是可以跟o1对标,但o1也不是超大模型。就在2025年下半年,也许更早,OpenAI会推出GPT-5,那将是一个超大的模型。它会像现在GPT-4o一样拥有端对端训练出来的多模态,它将不但能阅读图像,而且能阅读视频和音频,它将能处理海量的数据——所以它需要很多张GPU。DeepSeek不会放弃这种模型。再者,更重要的是,AGI、以及紧接着更重要的ASI,就是需要超大的算力—— 因为高级智能一定是通用智能。DeepSeek R1的效率高,有很多独创性的技术,但是我们也不能否认,其中有一定以牺牲宽度换取效率的成分。R1和之前的V3都是「混合专家(mixed experts)」模式,是可能最早法国的Mistral模型先采用的,是把智能分散开成若干个专家模块,每次遇到新任务就只调用相关的模块,而不必「全脑」一起思考,这就大大节省了算力。这个做法相当于你问我数学题我就用数学模块,问我古诗词我就用古诗词模块。但我们设想,对于更复杂的问题,也许就是需要同时调用几个领域的知识和思维模式才能解决。特别是创造力总是来自不同想法的连接,那么这个模块分割法就会限制发挥。再者,DeepSeek专注于数学、编程和语言处理这几个领域,也是为了节省算力不得不为之。就在最近,斯坦福大学李飞飞的团队发明了一个更激进的做法,号称只用不到50美元(有个说法是6美元)的训练费用就弄出一个数学解题水平跟R1、o1差不多的推理模型,叫S1。他们是怎么做的呢?第一,从开源的通义千问(qwen)的一个小版本语言模型开始,省去前期大规模的训练;第二,用一千道精选数学题专门训练数学解题能力,且只训练数学能力;第三,用Google Gemini的一个推理版本的推理过程的蒸馏数据来训练自己的推理能力。这个做法,就如同找个脑子快的孩子,给他一套精选习题集,让他背诵别人的解题套路。这样训练做题家当然快,但是这除了快没有别的贡献。这个做法不会像R1那样涌现出任何新能力,不会给你任何惊喜。这不是通往AGI之路。03更多的参数+更长的思考时间=更好的答案梁文锋胸怀大志,绝对不只是想提供一个便宜的做题家,而是想做AGI。接下来的情形,我估计,差不多是下面这样的——对于一般的日常任务,比如一般编程、搞个会议纪要、写个汇报工作的发言稿、弄个报表之类,只要用普通模型就可以,中国不但没问题而且可能有价格和服务上的优势,也许中国的模型是最好的。但对于科研任务,特别是探索最前沿突破,你需要能想得很广而且很深,你需要尽可能地堆积算力。我有个说法是如果一个科研团队愿意花5000美元问ChatGPT一个问题,而另一个同样水平的科研团队愿意花一万美元,那么后者将得到更好的答案——仅仅是因为模型愿意为他们思考更长时间。只要缩放定律仍然有效,那么,更多的参数+更长的思考时间=更好的答案也是更值钱的答案。接下来AI在科研领域会大有作为,科研发现的速度会加快,所以争夺会非常激烈。一种新药只能被发现一次,谁先做出来就是谁的。还有一个在我看来最重要的考虑,是谁先达到ASI。我们这里不妨定义ASI是「自己可以训练自己」的超级人工智能。那么谁先达到ASI,谁就等于是获得了一个绝对的领先优势。这就相当于战略游戏里谁先造出「奇观」来,能大大加强自己的战略优势。试想如果美国率先达到ASI,那就意味着以后的路全打通了,剩下的事只是给AI喂芯片喂电力而已,不需要人类科学家再有奇思妙想,可谓是高枕无忧——那到时候中国怎么办呢?还靠一帮人努力追赶吗?庆幸的是中国有个DeepSeek。就在DeepSeek的论文中,已经透露出一点迹象,模型自己给自己提出了一个算力优化策略。你可以说梁文锋已经看到了ASI的光线。我们设想OpenAI肯定也有类似的东西,但他们从未公开过。DeepSeek震撼美国这段时间,Anthropic CEO达里奥·阿莫迪(Dario Amodei)有一些公开言论,很耐人寻味。他说如果不限制中国发展AI,那会对全人类都有好处,我们会迎来突飞猛进的十年——但是中国会把AI用于军事,而这对美国很不利,所以他呼吁美国政府加强对中国AI的限制。他还说,真希望DeepSeek团队到美国来为他们公司工作。这些言论在X上遭到了美国网友的围攻。首先你作为一个科技公司CEO去强调地缘政治,这本身就是错的:科技应该为全人类服务。再者你咋这么会想呢?人家DeepSeek凭啥到美国来帮你干?这些言论进一步说明了DeepSeek的战略意义。接下来美国政府有可能加强对中国AI的限制,甚至完全脱钩,但也有可能松动英伟达的出口管制,毕竟跟特朗普什么都可以谈。不论如何,我们必须认准ASI这个大方向,而绝对不能满足于解解数学题、日常编程那些任务。总想四两拨千斤、少花钱多办事儿、以20%的投入解决80%的问题,那是走不远的。中国必须有人宁可选择费力又费钱的路。
Advertisements
回国带物的惨痛教训:新移民丢身份,判7年,前程尽毁(图)
img { height: 400px;width:600px;}回国度假,熟人请求带东西,相信很多人都经历过,认为这并不是什么大事。 然而,多伦多一名房地产经纪人的经历却为我们敲响了警钟:轻信他人,可能毁掉一生。据《国家邮报》报道:新移民维尔马(Nitish Verma)从印度返回加拿大时,因携带毒品在皮尔逊机场被捕。他声称自己被一位家庭朋友欺骗,受托带回一包“印度糖果”,却不知其中竟藏有鸦片。尽管他坚称自己毫不知情,但陪审团并不买账,最终他被判处七年监禁,并将在服刑期满后被驱逐出境。这一事件不仅毁了他的职业生涯,也彻底改变了他和家人的未来。图片来源:luggagent.com作为一位在加拿大打拼多年的移民,维尔马的生活原本充满希望。他于2010年从印度来到加拿大,就读于塞尼卡学院,毕业后成为一名小有名气的房地产经纪人,事业蒸蒸日上。然而,命运的转折点出现在2019年夏天。当时维尔马回到印度参加妹妹的相亲。他返回加拿大前夕,一位他称为“叔叔”的家庭朋友请求他帮忙带一些“糖果”回加拿大。出于信任,维尔马答应了,并在德里机场接收了几盒糖果和其他礼物。当维尔马抵达多伦多皮尔逊机场时,海关官员发现他的行李异常沉重,随即进行了二次检查。打开盒子后,里面竟是一块块用塑料包裹的黑色焦油状物质——鸦片。更令人震惊的是,官员还在他的衬衫口袋和腰包中发现了少量鸦片。这些毒品总重近14公斤,价值高达数十万加元。维尔马当场被捕,尽管他坚称自己毫不知情,但陪审团并不相信他的说辞。2023年,案件进入审理阶段。维尔马的辩护律师试图证明他是被欺骗的受害者,并强调没有证据表明维尔马与犯罪或毒品分销组织有任何联系,他也没有犯罪前科。检察官则指出,维尔马在审讯中曾提到“如果那个人发现,他会死”,这暗示他意识到自己携带的是毒品。此外,装有毒品的袋子是透明的,显然不可能被误认为是糖果。最终,陪审团认定维尔马有罪。维尔马的判决令人唏嘘。他曾是一个勤奋、有前途的年轻人,甚至在2021年联邦选举期间为特鲁多自由党担任志愿者。他的家人、朋友和同事纷纷向法庭提交支持信,描述他的良好品格。可是法庭的裁决无情地改变了他的人生轨迹。安省高等法院法官Lucille Shaw在宣判时表示:“一个如此有前途、得到如此多支持的人竟然犯下刑事犯罪,造成毁灭性后果,这让我感到悲哀。”判决不仅影响了维尔马,还有他的整个家庭。因一时的疏忽和轻信而毁于一旦,他的家人也因此承受了巨大的痛苦。维尔马的妻子,一位大学教授,原本计划移民加拿大与他团聚,但这一计划也因他的罪行而彻底破灭。Lucille Shaw法官指出:“他的妻子也是受害者,因为她计划移民加拿大和他一起组建家庭。但这个计划永远改变了,因为他的行为对移民产生了影响。”维尔马不服进行上诉,但是在本月21日,被安省上诉庭驳回,维持原判。维尔马的故事是一个惨痛的教训,提醒我们:轻信他人可能带来无法挽回的后果。无论关系多么亲密,涉及跨国携带物品时,务必保持警惕,切勿轻易答应他人的请求。尤其是在国际旅行中,海关检查极为严格,任何可疑物品都可能引发严重后果。毕竟,信任固然重要,但自我保护更为关键。
Advertisements
看完去年全球市场报告,我发现苹果的日子变难过了(组图)
img { height: 425.53191489362px;width:600px;}img { height: 340.90909090909px;width:600px;}img { height: 335.19553072626px;width:600px;}img { height: 368.0981595092px;width:600px;}img { height: 382.16560509554px;width:600px;}img { height: 408.16326530612px;width:600px;}img { height: 337.07865168539px;width:600px;}img { height:...
男子举报2277起违章:举报不为钱,不服就举报回来(图)
img { height: 337.07865168539px;width:600px;}据报道,广州一位男子,在开车上下班的一年时间内,利用行车记录仪,拍摄并举报路上的违章车辆。2024年,他成功举报了1945起违章,按照处罚标准计算,这些举报或将扣掉违法司机共计8998分。并且,他还将一些司机的违章视频,发布在自己建立的“野生摄像头”视频账号上。此事也在网上引起争议,有网友大力支持这位“马路判官”,但也有网友骂其多管闲事。对此,当事人接受采访时表示,交通违章这么频繁、常见,我个人觉得,部分原因是道路本身的设计存在不合理之处,但更重要的原因,是很多人不把交通法当回事。还有网友在他视频评论区中说,“谁没违章过?”“我违章没有影响到你,为什么要多管闲事举报我?”“道路不合理,我违章咋了?”甚至一些网友对其进行辱骂,认为他是奔着举报奖金去的,但在广州,交规违章的举报人无法获得任何形式的奖励。男子表示:“交通违法就是违法,希望每个违章都有代价,交通秩序才会好,开车才会更舒心。”
Advertisements
Breaking
中国翼龙-2无人机出口数百架,横扫中东北非(图)
从北非沙漠的反恐突袭到中东战场的精准打击,一款中国无人机的身影总能引发关注。这就是翼龙-2无人机。如今,这款由中航工业成都所研制的中高空长航时侦察/打击一体化无人机,已走过8年征程。在8年间不仅接过翼龙-1的旗帜,成为解放军列装的主力装备,更是出口数百架,足迹遍布南亚、中东、北非等地区,被誉为“中国迄今为止最成功的军用无人机之一”。作为翼龙-1无人机的升级款,翼龙-2以“大型化、全改进”为目标,重点提升飞行速度、高度和装载能力,于2017年2月27日首飞。基本参数亮眼:机长11米、翼展20.5米,最大起飞重量4200公斤,外挂载重420公斤,最大飞行速度370公里/小时,最大升限9000米,续航时间超过20小时,综合性能较前代实现跨越式提升。翼龙-2采用正常式气动布局,大展弦比中单翼搭配V型尾翼,机翼带襟翼和襟副翼,V型尾翼省去了传统的方向舵与升降舵。这种设计展弦比更大,升力足、诱导阻力小,巡航时的升阻比优势明显,能更高效地完成长航时任务。外观上,机头和机身折角都做了隐身处理,配合新增的2个翼尖小翼,既降低了雷达反射信号,又增加了升力、延长了航程,实用性与隐蔽性兼顾。性能跃升的核心,离不开动力系统的升级。翼龙-2 搭载涡桨发动机,平台飞行性能与载荷能力显著提升,这也为配备6个外挂点创造了条件。这些挂点可灵活搭载各类武器:从十几公斤到100公斤级的精确制导导弹、炸弹,再到非制导火箭弹,既能单挂也能多联装,还支持混合挂载。这种配置能根据不同作战需求快速调整,任务适应性极强。据中航工业成都所介绍,在“大脑”与“神经”系统上,翼龙-2有了巨大改进。在数据链方面,配备视距内数据链(覆盖200~250公里)和超视距卫星链路,通过加密处理和时间延迟补偿,确保数据传输的速率与安全性;在控制系统方面,首次实现“一站双机”操纵,支持双机协同作战,作战效率大幅提升。8年来,翼龙-2 家族不断壮大,衍生出多个针对性型号:翼龙-2D专注情报、监视与侦察;翼龙-2 反潜巡逻型和海警型侧重海上任务;维和型、应急救灾型、气象型则拓展至非战争领域;翼龙-2Y 专攻中低空无人机、巡航导弹及集群目标的监视与拦截。最重要的改进型是被中国空军采购的攻击-2型。攻击-2无人机取消了翼尖小翼,可携带500公斤载荷,高空经济航速下续航超24小时,配备微波、卫通、数据链和飞控系统,依托红外/电视/激光多通道态势感知,能挂载卫星制导或半主动激光制导的空地导弹、BDS/INS精确制导炸弹、反坦克导弹等武器,对地攻击能力精准可靠。上图紫色区域意为引进装备翼龙-2察打一体无人机的海外国家。在国际市场上,翼龙-2的表现非常抢眼。阿联酋是首个海外用户,也是翼龙-1的早期买家,此后阿尔及利亚、埃及、尼日利亚、巴基斯坦、沙特阿拉伯、乌兹别克斯坦等国陆续订购。在2018年翼龙-2无人机就实现出口百架的成绩,到现在的出口数量已经有数百架。这些无人机在实战中屡创佳绩:尼日利亚突袭“博科圣地”恐怖组织藏身处,沙特打击胡塞武装控制区,利比亚内战中甚至能“横扫”土耳其TB-2无人机,成为海外用户心中的“可靠战力”。如今,摩洛哥、刚果(金)等国都表现出浓厚兴趣,中国外贸军用无人机的国际口碑持续升温。如今放眼望去,从尼日利亚对“博科圣地”恐怖组织成员藏身处的突袭、到沙特对胡塞武装控制区的打击、再到利比亚内战中完成对土耳其TB-2的横扫,可谓处处都有翼龙-2的身影,足见其在海外用户心目中的地位。另外得益于品牌效应与出色的效费比,促使翼龙-2正在被越来越多的国家所看中,诸如摩洛哥、刚果(金)等,据称已对翼龙-2表现出了浓厚兴趣,这对翼龙-2来说无疑是件大好事。从首飞到驰骋全球,翼龙-2是中国高端装备从“跟跑”到“并跑”的缩影。翼龙-2的成功,为中国无人机产业铺就了更宽的路。中航工业成都所已顺势推出翼龙-3、翼龙-10A/B等新型号,这些机型技术更先进,任务各有侧重,全面对标西方一流装备,部分型号已实现出口。依靠翼龙-2打下的市场基础和口碑之上,中国无人机正朝着“多机型全面开花” 的目标迈进。未来,随着技术持续迭代,中国无人机必将在更多领域书写属于“中国制造”的传奇。
被中方反制的2家欧盟小银行,是什么来头?(组图)
13日,中国商务部发布消息,中方决定将欧盟UAB Urbo Bankas和AB Mano Bankas两家银行列入反制清单,并采取以下反制措施:禁止我国境内的组织、个人与其进行有关交易、合作等活动。公开资料显示,上述两家遭反制的银行总部均位于立陶宛维尔纽斯。业内人士指出,两家银行总资产规模为6.68亿欧元(约合人民币56亿元)和4.5亿欧元(约合人民币37.8亿元),相当于中国国内较小的农村商业银行,与上月被欧盟首次列入制裁名单的两家中国金融机构规模相当。香港《南华早报》注意到,立陶宛方面屡次对中国内部事务指手画脚,因涉台问题已成为中方制裁目标。2021年11月,立陶宛批准台湾当局设立所谓“驻立陶宛台湾代表处”,中方宣布与立陶宛双边外交关系降为代办级。2022年8月,中方针对立陶宛交通与通讯部副部长瓦伊丘凯维丘特实施制裁,暂停同立交通与通讯部任何形式的交往,暂停同立国际道路运输领域交流合作。UAB Urbo Bankas关于此次被反制的两家欧盟银行,官网介绍,Urbo Bankas自1992年11月24日起营业,2024年2月起由Medicinos Bankas改为现名,其愿景一栏称希望“成为中小企业的首选综合性银行,并在私人银行业务领域与其他银行平等竞争。”截至2025年第一季度,Urbo...
科展涉抄袭遭撤销台大医资格 女学霸分科再考回台大医
台中一名女高中生今年繁星录取台大医学系,却被爆科展抄袭,遭科教馆撤销该作品参展资格及所获奖项,台大最终也撤销该生录取资格。分科测验入学13日放榜,传出该生再次考取台大医学系。对此,台大表示,「不特别说明个案」。该生高中校方则对此事不做回应。
台中一名女高中生通过繁星推荐管道录取台大医学系,却被爆科展作品疑似抄袭指导教授的期刊论文。主办台湾科展的科教馆6月23日公告,确认该份科展作品,有违反研究伦理之情事,判定撤销该作品参展资格及所获奖项,也追回奖状与奖金。台大接获检举后重新审议,7月14日决议撤销该生录取资格。
据了解,该名女高中生在台大决议撤销录取资格前,早已提前报考分科测验,分科测验放榜后,据传该生再次考取台大医学系。对此,该生高中校方表示,学校不会公布学生成绩,对此事不做回应。
网传该名女高中生分科录取台大医学系后,不少网友给予正向肯定,有网友说「一年考上两次台大医科,谁能超越」、「真金不怕火炼」、「人家本来就有足够实力考上」,更有网友封她为「新一代女战神」。
台媒批张本智和:白眼狼!流中国人的血却忘本(图)
北京时间8月14日,日本选手张本智和引起的争议还在持续发酵,中国台湾的媒体对此发表了自己的看法。在刚刚结束的WTT横滨冠军赛上,张本智和屡屡引发争议,比如不满国乒男队主帅王皓握手“敷衍”,批评早田希娜使用医疗暂停并取关,自己对阵王楚钦却叫了医疗暂停还疑似诈伤,等等。比赛结束之后,张本智和还表示,这场胜利不仅是自己的胜利,也是横滨和全体日本人的胜利,这也引起很大争议,因为他的父母都是中国人,有中国血统。对此,中国台湾媒体报道称:赢了球却输了人品,张本智和胜之不武,白眼狼。”媒体人表示:“张本智和一家他们还没有得到日本国民的认可,到现在还是排外的:你虽然帮我们日本争光,可是我们一点都不感到喜悦这就是日本民族性使然,就算你归化为它的国民,它都不觉得是真正的光荣,我们真的要认清事实的真相。”另一位媒体人表示,这个就是会不会做人的问题。王楚钦被视为“球王”,情商和智商都很高,与媒体讲话非常谨慎,非常得体。而张本智和不够聪明,这次做了一个非常差的示范。知名评论员介文汲则表示,“张本智和完全忘记自己的中国人血统,他的父母都是中国人,忘本了,虽然归化为日本人,但日本人也不会尊敬他,人家也会看低你。”