为您找到相关结果约2782个
AI算力需求扩张与成熟制程供给收紧的双重驱动下,电源管理芯片(PMIC)行业新一轮涨价周期正加速成形,中国台湾PMIC厂商的议价能力出现实质性改善。 致新董事长吴锦川近期公开透露,5月初以来已有多家同业陆续发出涨价通知;在供给端偏紧、产能不足且交期持续拉长的背景下,致新已陆续与客户展开涨价协商。这是目前业内最直接、最具代表性的涨价信号。 据报道,8英寸晶圆成熟制程供需格局出现明显转变,部分晶圆代工厂已率先调涨代工报价,市场预期类比IC与PMIC供应链的议价能力将持续提升。矽力杰、致新、茂达等中国台湾PMIC厂商的下半年营运前景,由此受到机构的广泛关注。 今年前五月,三家公司营运表现分歧,但在AI电源管理、DDR5 PMIC及风扇马达驱动IC等多重题材支撑下,分析普遍预期下半年营运将逐步增温。 8英寸供需逆转,涨价逻辑成形 8英寸晶圆成熟制程的供需格局正在发生实质性转变。台积电、三星陆续调整8英寸产能配置,全球8英寸晶圆供给增幅有限,而AI电源管理IC、功率元件、显示驱动IC及车用工控需求同步升温,共同推动产能利用率持续回升。 业界分析指出,过去两年PMIC受消费电子库存修正拖累,报价与稼动率持续承压; 今年随AI服务器、数据中心、DDR5、车用与工控需求陆续接棒,成熟制程产能不再宽松,PMIC有望从景气循环修复进一步走向结构性成长。 致新5月合并营收7.49亿元新台币,月增0.41%,年减3.28%;累计前五月合并营收36.06亿元。尽管营收同比小幅承压,但董事长吴锦川透露,5月初以来已有多家同业陆续发出涨价通知,在供给端偏紧、产能不足与交期拉长的压力下,致新正陆续与客户协商涨价事宜。与此同时,市场尤为关注致新在DDR5/LPDDR5 PMIC领域的产品布局,该方向被视为公司未来营运成长的重要驱动力之一。 矽力杰5月合并营收19.11亿元新台币,月减5.11%,年增31.59%;累计前五月合并营收87.84亿元,年增23.21%,增长势头在三家公司中最为强劲。矽力杰近年来积极扩大数据中心、工业、车用与高阶电源管理产品布局。其中,AI ASIC相关Vcore产品已完成送样并持续推进量产时程;若后续客户验证顺利,该产品线有望成为公司明年营运的新增动能。 茂达5月合并营收6.86亿元新台币,月增0.51%,年增15.42%,创近48个月新高;累计前五月合并营收33.48亿元,年增12.72%。茂达的营运亮点不止于PMIC需求回温。分析认为,茂达旗下风扇马达驱动IC同步受惠于AI PC、电竞笔电、服务器与工业设备散热需求的提升。随着AI运算带动终端设备功耗持续走高,散热与电源控制需求同步升级,茂达因此具备PMIC与散热驱动IC的双重题材支撑,被视为此轮行业景气上行的受益公司之一。
在经历了一场代价高昂的劳资奖金纠纷后,三星电子正试图通过一场彻底的技术变革来重塑其半导体制造的权力格局。 据媒体报道,三星近日正式推出数据共享生态平台(DSEP)并引入AI工厂操作系统,明确设定了到2030年实现半导体工厂完全无人化的战略目标。 这一激进的自动化转型不仅旨在提升先进制程的生产效率,更被市场视为管理层从根本上削弱工会谈判杠杆、降低长期人力成本风险的防御性举措。 对于投资者而言,这意味着三星正将短期的劳资阵痛转化为长期的资本开支与AI技术升级,未来存储芯片市场的供给逻辑与制造成本结构或将迎来深远重估。 DSEP与AI驱动:2030无人化工厂的技术路径 三星的无人化战略并非停留在概念阶段,而是已经具备了清晰的技术落地路径。其核心依托于新建立的数据共享生态平台(DSEP)。通过该平台,三星计划与特定合作伙伴共享实时的半导体工艺数据。 在数据共享的基础上,三星正将这些海量实时数据输入其基于AI的工厂操作系统。这一系统的最终目标是在2030年底前解锁半导体制造的完全自动化。通过AI对工艺数据的深度学习与实时反馈,三星期望在减少人工干预的同时,提升晶圆代工厂和存储芯片产线的良率与运营效率。这种从“人力驱动”向“数据与AI驱动”的范式转移,构成了三星未来十年制造战略的技术底座。 奖金大战与罢工阴霾:工会杠杆的极限施压 三星加速推进无人化战略的直接催化剂,是近期一场成本高昂且激烈的劳资博弈。此前,三星管理层拒绝了韩国中央劳动委员会的调解方案,导致劳资薪酬谈判彻底破裂。近4.8万名工人一度宣布展开为期18天的总罢工,核心分歧直指废除奖金上限及利润划拨机制。 在这场冲突中,工会展现出了极强的谈判杠杆作用,全面罢工落地曾对DRAM和NAND闪存的全球供给造成严重威胁。尽管韩国水原地方法院随后裁定批准了三星的部分禁令申请,将半导体生产流程纳入安全保护设施范畴,要求罢工不得影响产量,否则将面临每日约1亿韩元的罚款,但劳资对立的裂痕已经形成。三星电子董事长李在镕也就此次2020年以来最严峻的劳动争议首次公开致歉。 自动化重塑成本结构:削弱筹码与行业启示 从长远来看,三星的无人化计划是一场旨在夺回企业管理主动权的战略反击。半导体工人或许在近期的奖金分配战中取得了阶段性胜利,但随着自动化进程的加速,他们正面临在长期博弈中失去筹码的风险。 通过实现2030年完全无人化,三星将大幅优化长期人力成本结构,并消除因罢工或劳资纠纷导致的产能中断风险。当AI系统和自动化设备成为产线主力时,工会赖以施压的“停工威胁”将被实质性瓦解。 这一战略转向也为全球半导体制造业提供了重要启示。在先进制程研发成本飙升、供应链不确定性加剧的背景下,头部晶圆厂正加速向“黑灯工厂”演进。对投资者而言,评估三星等半导体巨头的长期价值时,除了关注其技术节点的突破,其在AI制造领域的资本开支效率以及通过自动化对冲运营风险的能力,正成为不可忽视的核心指标。
由人工智能热潮推动的韩国芯片产业繁荣,正令该国通胀前景趋于复杂。韩国央行警告,三星电子、SK海力士等芯片巨头发放的异常丰厚奖金,可能引发跨行业薪资竞争,进而推高消费需求与企业成本,成为通胀压力的新来源。 6月17日,韩国央行发布报告指出,部分芯片企业的高额奖金发放,可能推高其他行业员工的加薪诉求,并 通过消费扩张和劳动力市场传导,将薪资压力扩散至更广泛领域 。央行行长Shin Hyun Song表示, 持续高企的通胀可能强化消费者的通胀预期,并增加企业提价的可能性,形成"通胀自我强化"的恶性循环。 与此同时,中东战争带来的能源价格冲击进一步加剧了韩国的通胀压力。韩国5月消费者价格指数(CPI)同比上涨3.1%,创逾两年来最快增速。Shin Hyun Song上周已明确表态,央行应"在为时已晚之前"启动加息。 在此背景下,AI驱动的薪资扩散效应与能源冲击叠加,令决策者面临更为复杂的政策权衡。 奖金扩散的三条传导路径 韩国央行报告详细梳理了科技行业高额奖金向整体经济传导的机制。 其一,薪资竞争效应。 龙头科技企业大幅提升薪酬后,其他行业雇主为留住员工,可能被迫跟进加薪,推高全行业劳动力成本。 其二,消费需求效应。 科技从业人员收入增长将直接提振服务消费支出,带动餐饮、零售、娱乐等服务业需求扩张,进而推高相关价格。 其三,劳动力市场溢出效应。 服务业需求上升将带动该领域用工需求增加,进一步收紧劳动力市场,形成新一轮薪资上涨压力。 央行指出,尽管目前尚未出现广泛的薪资加速增长迹象,但异常高额的奖金发放与不断上升的加薪诉求已值得密切关注,决策者需防范暂时性供给冲击演变为持续性通胀压力。 能源冲击叠加,通胀或长期高企 科技行业薪资扩散的隐忧,叠加中东局势引发的能源价格冲击,令韩国通胀前景更加严峻。 韩国央行在这份半年度评估报告中预计,即便油价从近期高位逐步回落, 通胀仍可能在较长时间内维持高位。 报告预测,今年下半年消费者价格涨幅将维持在3%左右,核心通胀率则预计保持在2%中高区间,原因在于能源相关成本正持续向更广泛的经济领域渗透。 央行援引俄乌冲突的历史经验指出,能源冲击通常在约六个月后开始影响工业品、非能源商品及服务价格,且即便油价涨势趋缓,其对通胀的传导效应仍可能持续相当长时间。 面对多重通胀压力, 韩国央行的政策立场已明显趋鹰。 Shin Hyun Song在报告发布后表示,央行将密切监测通胀前景,并"主动应对,直至确信通胀将稳定在目标水平"。他上周更直接呼吁,央行应在"为时已晚之前"启动加息,措辞之强硬在近期较为罕见。
英伟达与Coherent的光互联战略正从纸面走向地基。 6月16日,英伟达创始人兼CEO黄仁勋与Coherent CEO Jim Anderson共同出席了位于德克萨斯州Sherman市的Coherent扩建厂房破土动工仪式。 此次扩建将扩大全球首条6英寸磷化铟(InP)晶圆量产线的产能,为英伟达AI基础设施提供关键光学互联器件。 Coherent同步宣布获得5000万美元CHIPS法案补贴,用于支持该设施建设。 此次动工是英伟达今年3月宣布向Coherent投资20亿美元、并作出数十亿美元采购承诺后的首个实质性落地节点,标志着双方长达约二十年的合作关系进一步深化。这一进展强化了光学互联赛道在AI基础设施建设中的核心地位,也为Coherent的产能扩张提供了更清晰的时间线。 光学互联:AI扩张的物理瓶颈 随着AI系统规模持续扩大,铜缆传输的物理极限正成为数据中心的现实约束。 黄仁勋在动工仪式上解释,当576块GPU跨越八个机架作为单一系统运行时——如英伟达即将推出的Vera Rubin Ultra NVL576所设计的那样——铜缆已无法承载跨机架的信号传输。随着信号速率提升,金属走线的有效传输距离不断缩短,若强行以铜缆连接八个机架,数据中心将不得不在信号调理和重定时器上消耗大量电力,而这些电力本可用于计算。 光学方案虽需承担一次性的电-光转换损耗,但一旦完成转换,距离几乎不再产生额外代价。在NVL576规模下,光互联是最具能效优势的选择。 Jim Anderson将这一逻辑浓缩为一句话:"AI靠算力运行,但靠连接扩展——Sherman就是这条连接组织的制造地。" 6英寸InP晶圆:产能跃升的技术支点 Coherent在Sherman运营的,是其自称全球首条6英寸磷化铟量产线。这一规格在化合物半导体领域具有显著意义。 目前全球大多数InP产线仍停留在3英寸或4英寸晶圆阶段。由于晶圆面积与直径的平方成正比,从3英寸升级至6英寸,可用面积约扩大四倍,直接拉升单批次产出的器件数量,并大幅摊薄单位成本。这一良率与成本结构的改善,正是AI大规模建设所需的供给基础。 黄仁勋在仪式上表示,建成第一条产线花了50年,而在过去一年内,产能已扩大了四倍,这本身就是加速计算需求的一个度量。 此次扩建厂房将生产InP晶圆,并最终封装为可插拔光模块——外形约与U盘相当,直接插入英伟达网络交换机前面板,在铜缆无法覆盖的数据中心机架间传输数据。这些模块同时为英伟达Spectrum-X Photonics和Quantum-X Photonics共封装光学交换机提供外置激光模块。 政策资金与私人资本双轮驱动 此次扩建获得了来自公共与私人两侧的资金支持。 在公共资金层面,Coherent宣布获得5000万美元CHIPS法案补贴,叠加此前来自德克萨斯州CHIPS项目及Sherman经济发展公司约1700万美元的早期支持。CHIPS法案总规模约500亿美元,旨在推动芯片制造回流美国本土。 在私人资本层面,英伟达今年3月宣布向Coherent投资20亿美元,用于支持研发、未来产能扩张及美国本土制造,并附带数十亿美元的先进激光与光网络产品采购承诺。英伟达此前还宣布通过行业合作伙伴关系,在亚利桑那州和德克萨斯州新建基地,计划在美国生产最高达5000亿美元的AI基础设施。 黄仁勋在仪式上表示:"Coherent是一家世界级公司,你们所做的工作对我们的未来、对人工智能的未来、对美国再工业化至关重要。"
AI推理基础设施市场正面临一轮显著的成本与供给冲击。 在美国知名风投机构Altimeter近期举办的活动上,AI推理基础设施服务商Baseten首席执行官Tuhin Srivastava透露, 其云服务商已于今年5月提前通知,英伟达B200 GPU的每小时租赁单价将在10月合同续约时,从现行的2.63美元涨至5.10美元,涨幅约94%。 他强调,这一数字的关键不在于绝对价格水平,而在于其所折射出的供需失衡程度——云服务商提前数月主动报价,本身即表明在算力持续紧缺的背景下,需求方已几无议价空间。 与此同时,供给端紧张态势同样未见缓和。据Tuhin Srivastava介绍, 当前采购1000块GPU的交付排期已普遍延至明年第二季度,等待周期长达12至15个月 。交付瓶颈与租赁价格上涨形成叠加效应,企业即便加大投入,短期内亦难以通过采购途径补足算力缺口。价格上行与供给瓶颈双重挤压下,AI推理的成本正面临实质性抬升。 Baseten成立于2019年,总部位于旧金山,定位为生产级AI推理基础设施服务商,业务涵盖模型部署、管理、扩展与监控,提供多集群、多云环境的弹性扩展支持,并辅以性能研究与嵌入式AI工程服务。截至2026年1月,公司已完成D+轮融资,并获得英伟达战略投资。
日本出口强劲反弹,但繁荣表象之下暗藏隐忧。 据日本政府周三最新数据,5月出口额同比增长17%,创2022年11月以来最快增速,超出路透调查经济学家预期的16.2%,较4月的14.8%明显加速。 半导体出口在人工智能需求爆发的推动下激增61.2%,成为此轮出口增长的核心引擎。 然而,据路透报道,大和综合研究所经济学家Koki Akimoto指出,价格效应——包括日元贬值和能源成本上涨——是推动出口名义值走高的重要因素,以量计算的出口仅增长0.5%。 "整体出口量几乎没有增加,出口缺乏内在动力," 他表示。与此同时,美伊战争引发的中东供应链中断对日本石油进口造成严重冲击,并拖累对中东地区的出口大幅下滑。 芯片与汽车双轮驱动,对华对美出口同步走强 5月出口增长呈现明显的结构性特征,半导体和汽车是两大核心支柱。 官方数据显示,半导体等电子元器件出口同比激增61.2%,受益于全球人工智能热潮带动的数据中心建设需求,内存芯片及有色金属价格随之大幅攀升。汽车出口同比增长16.4%,同样表现强劲。 从目的地来看,对中国出口同比增长17.9%,对美国出口增长12.5%。中国是日本最大贸易伙伴,美国位居第二。两大主要市场的同步扩张,为整体出口提供了坚实支撑。 相比之下,中东方向出口受美伊战争冲击明显,同比下滑32%。 价格驱动掩盖量增乏力,贸易逆差收窄但结构存忧 尽管出口名义增速亮眼,但以量计算的出口仅增长0.5%,揭示出数据背后的结构性软肋。 Akimoto表示,日元疲软和能源成本上涨是推高出口和进口名义值的重要驱动力,实际贸易量的改善十分有限。"随着时间推移,供应中断推高的油价往往会通过恶化贸易条件、压制全球需求,最终拖累出口前景,"他补充道。 进口方面,5月同比增长12.5%,为2025年1月以来最高增速,但略低于市场预期的12.8%。石油进口受霍尔木兹海峡封锁影响大幅萎缩——原油进口量同比骤降57.3%,价值量下滑28.5%,但每单位进口成本(以日元计)创历史新高。日本政府已着手多元化原油采购渠道,包括扩大自美国的进口(同比增长24%),但尚未完全弥补中东供应缺口(中东原油进口量同比下滑61.9%)。 综合来看,5月贸易逆差为3787亿日元(约合23.6亿美元),好于市场预期的5646亿日元逆差。 日本央行加息落地,强劲数据难掩政策两难 贸易数据发布的同日,日本央行宣布将政策利率上调25个基点至1%,为逾30年来最高水平,理由是通胀持续上升及日元持续疲软。 日元贬值在短期内有助于提振出口名义值,但同时加剧进口通胀压力,削弱居民购买力,形成政策层面的两难困境。市场对上述数据反应平淡。数据公布后,日本基准股指日经225指数下跌0.5%,日元兑美元汇率几乎未动,报160.4。
6月16日,据韩国最具影响力的财经媒体之一《韩国经济日报》报道, SK海力士计划在完成美国存托凭证(ADR)上市后,于今年第四季度推出规模最高达100万亿韩元(约合664亿美元)的股东回报方案 ,涵盖股份回购注销与现金分红。 与此同时,公司拟将通过发行新股募集的资金,专项用于人工智能基础设施建设。投资银行界人士向该媒体透露, SK海力士近期面向全球机构投资者的路演已获得积极反馈,公司预计将在ADR上市完成后、第三季度业绩发布前后,正式对外公布上述方案。 市场分析认为,此举是SK集团会长崔泰源在全球资本市场重估公司价值之际,借力大规模股东回报政策巩固企业市场地位的关键战略布局。 但针对该报道中的具体规模,界面新闻从SK海力士方面获得的独家回应给出了不同说法。公司明确表示, 其“为提升股东价值正探讨多种方案,但从未探讨过相关报道中所涉及的股东回报规模等具体内容”。 上市倒计时,募资瞄准AI基建 据华尔街见闻此前文章,SK海力士已于今年3月向美国证券交易委员会(SEC)秘密提交上市申请。据路透社此前报道,SEC可能在6月22日当周批准其ADR上市申请,挂牌地点选定纳斯达克,最早可于8月完成上市。 通过新股发行募集的资金,计划主要用于韩国龙仁半导体产业集群建设等人工智能基础设施项目,该集群总建设成本估计高达600万亿韩元。 强劲AI需求驱动,市场高度共识支撑资本运作 支撑上述大规模资本运作的,是市场对SK海力士下半年业绩的高度预期。 市场预计,SK海力士2026年全年营业利润将超过250万亿韩元,有望创下历史最高纪录。报道指出,公司在高带宽内存(HBM)市场的主导地位,令其创出历史最高营业利润及自由现金流几乎已无悬念。 作为英伟达的核心供应商,SK海力士在AI服务器所需HBM芯片领域占据市场领先地位。据路透社此前报道, SK海力士在推进美股上市过程中获得了“极为积极”的市场反馈,原因正在于强劲的AI需求及其在存储芯片市场的竞争优势。 SK海力士股价年初至今已累计上涨约252%,市值于今年5月突破1万亿美元。截至16日收盘,市值已达1697万亿韩元。
随着生成式AI的演进,智能设备正在经历从“应用程序主导”向“AI代理主导”的范式转变,这将引发全球算力基础设施与底层半导体架构的全面升级周期。 本周稍早前,高通CEO克里斯蒂亚诺·阿蒙(Cristiano Amon)在位于伦敦的CNBC新演播室接受了《The Tech Download》栏目的独家专访。在与资深科技记者Arjun Kharpal的对谈中,阿蒙详细阐述了AI时代下个人电子设备的演进图景。 针对市场高度关注的终端需求疲软与未来增长动力问题,阿蒙给出了一个极具爆发力的判断: 2026年将成为“AI代理(Agent)之年”,现有手机、PC和汽车算力均无法满足需求,全球将迎来新一轮设备换机与芯片升级周期。 他认为,AI带来的不仅是功能的增加,而是整个计算平台的重构。目前的设备算力远不足以支撑即将到来的AI代理生态。 “我相信, 我们今天拥有的所有设备都没有为这个未来做好准备 。”阿蒙在访谈中直言,“你将不得不升级你的手机,不得不升级你的个人电脑,你的汽车也将得到升级。这是一种全新的计算形式和软件形式,它需要一种全新的硅芯片架构。” 为了适应这种升级,高通的整个产品路线图正处于全面升级的过程中。阿蒙透露,在端侧运行越来越复杂的模型, 意味着专用于运行AI模型的硅片面积必须大幅增加。 不仅GPU和神经网络处理器(NPU)变得至关重要,中央处理器(CPU)也正在迎来复兴。因为未来AI代理需要执行高度复杂的任务,如检查数据、调用模型、连接互联网,而“这些编排器都存在于CPU上”。据悉,高通将于6月24日公布其最新的数据中心CPU产品。 2026年将是“AI代理之年”,手机将拥有“双重人格” 市场一直在寻找能够真正刺激消费者换机的“杀手级应用”。阿蒙指出,传统的AI聊天机器人只是一个开端,真正的行业拐点在于“AI代理(Agentic AI)”的普及,这种智能体能够自主地代表用户执行任务。 “我非常确信,2026年将是‘AI代理之年’,我们现在正看到这种趋势开始形成规模。”阿蒙预测道。 对于智能手机的未来,阿蒙明确表示手机绝对不会消失,但我们使用手机的方式将发生根本性变化。他用了一个生动的比喻: “你的手机将拥有‘双重人格’(dual personas)。 当你从口袋里拿出手机时,你仍然可以像以前一样打开App做事;但同时,手机也会拥有编排器和代理,它将代表你操作手机,自动调用你的应用程序。” 这种转变将彻底颠覆现有的App生态。阿蒙举了银行业务的例子:未来的用户不需要再打开银行App去适应开发者设计的界面,而是直接向AI代理下达指令。代理将拿着用户的凭证,自动完成查询、绘图和转账操作,并以用户最喜欢的颜色和形式将结果渲染在屏幕上。“App并没有死,但它们将演变成代理,变得更加强大、更加定制化,并被整合到一切事物中。” 智能眼镜将成下一个核心终端,AI巨头入局硬件争夺“数据端点” 在谈及未来设备的想象空间时,阿蒙对智能眼镜的商业前景给予了极高的确定性。 “100%(会成为最重要的设备之一)!数字自己会说话。”阿蒙给出了清晰的市场预期:“目前智能眼镜每年的出货量已经达到数千万台的量级。我们已经看到了清晰的视线,几年内,这个数字可能会达到数亿台,甚至可能变得和智能手机一样大。要知道,智能手机每年的销量大约是12亿部。” 阿蒙解释了眼镜形态的天然优势:人类本来就有戴眼镜的习惯,且眼镜离眼睛、耳朵和嘴巴最近,最适合配备摄像头和麦克风,让AI模型“看到你所看到的,听到你所听到的”,实现多模态的自然交互。 除了眼镜,别针(Pins)、珠宝、吊坠等全新形态的设备也将百花齐放。 值得注意的是,阿蒙指出目前的消费电子玩家格局正在发生剧变。过去,手机厂商主导了从手表到耳机的垂直生态系统;但在AI时代,“代理”成为了数字生活的中心,这为非传统硬件公司创造了机会。OpenAI等纯AI软件巨头开始涉足硬件设计,其核心驱动力在于对未来数据的渴望。 阿蒙一针见血地指出了其中的商业逻辑:“当人类戴着智能眼镜四处走动时,产生的数据量是巨大的,呈指数级大于我们过去用来训练模型的数据。那些AI公司需要赢得这些代理的‘终端节点(end points)’,因为获取这些定制化的消费者数据对于训练未来的模型至关重要。” 半导体并非单纯周期波动,2027年下半年或迎产能拐点 随着算力需求的爆炸式增长,从高带宽内存到晶圆代工,整个半导体供应链正面临严重的产能瓶颈。 当被问及如何应对内存短缺等挑战时,阿蒙打趣道: “首先,如果你有内存,我会从你那里买下来。” 针对市场关于半导体行业是否只是处于传统周期性波动的争议,阿蒙给出了否定的看法。他强调,这并非简单的行业周期,而是底层的结构性变革。“我觉得这次有点不同。世界上整个计算基础设施都已经升级了。AI基本上是一种运行的软件不同方式,你需要不同且更强大的计算机。代币(Tokens)是AI世界的新货币,现有的计算基础设施根本没有能力处理,必须经历一个升级过程。” 对于产能瓶颈何时能够缓解,阿蒙给出了相对乐观的时间表。相比于市场上“2028年才能解决”的悲观论调,阿蒙表示:“ 我相对更乐观一些。我认为在2027年的某个时候,或者至少是2027年下半年,我们应该会看到更多产能释放。” 他认为,更高效利用内存的全新芯片架构,将为高通这样擅长低功耗和高效率设计的公司创造巨大的市场机遇。 以下为访问全文,由AI协助翻译 Kharpal: 欢迎来到 The Tech Download。 我是Arjun Kharpal,CNBC的高级科技记者,我们将以一个超级有趣的嘉宾开场,Cristiano Amon,他是高通的首席执行官。 如果你不了解高通,简单介绍一下。他们是世界上最大的半导体公司之一。他们设计所谓的“系统级芯片”,我们会深入探讨,SoC,你可能听说过这个词,在骁龙品牌下。 这些芯片用于智能手机,它们上面有大量不同组件,它们为世界上大量智能手机提供动力,它们也为其他类型的设备提供动力,比如笔记本电脑。因此,这位首席执行官对消费电子以及这个行业在AI时代的发展方向有着很好的洞察。所以,我们将讨论所有的事情,即将推出的设备的热潮,他还告诉了我们一些尚未公布的设备。 他将谈论AI如何改变我们与核心设备——智能手机的关系。他还将谈论AI对高通需要开始考虑如何设计未来设备芯片的方式意味着什么。 在这次对话以及未来其他节目中,你会经常听到的一个词是“Agentic AI”。 这里的想法是,我们最初从这种聊天机器人开始,一种输入方式,我们问问题,它给我们回应,但实际上这些AI公司正试图更进一步。他们希望这些AI聊天机器人有效地充当助手,就像代表我们行事的代理,有时自主地代表我们执行任务。 然后你会听到高通CEO谈到的其他一些使AI设备成为可能的创新。其中之一是MCP,或模型上下文协议。 这实际上是一个开源系统,用于AI助手连接和与其他数据以及其他应用通信。这很重要,你想一下,如果你希望你的代理能够去另一个应用上为你执行任务。 然后你会听到的最后一项创新是所谓的云端与边缘处理。 所以,很多时候当我们使用这些AI聊天机器人时,实际上,你的数据被发送到云端,在那里处理,然后返回到你的设备,你实际上得到你的答案。 但许多设备制造商正在思考如何将那些AI模型和AI处理过程实际运行在设备本身上。 这可能意味着速度更快、更安全,这也是高通在其芯片上正在努力的方向。 我很高兴为大家带来与高通CEO Cristiano Amon的对话。欢迎来到 The Tech Download。 Cristiano,非常感谢你加入 The Tech Download。 Amon: 非常高兴来到这里,期待这次对话,Arjun。 Kharpal: Cristiano,你看,今天我们讨论AI设备,未来我们将如何与个人电子设备互动,因为AI正在这些设备中大量普及。 但我想首先对我们的观众重要的是,当我们谈论AI设备、AI智能手机、AI笔记本电脑时,那到底是什么意思? 看,这是一个很好的讨论话题,尤其是因为我们现在已经到了AI转型旅程的节点,我们有了清晰认识,你知道,那些设备将是什么,以及你将做什么。 Amon: 但我会这样回答你的问题:你仍然会有你的手机,你的手机不会消失,但你的手机会变得更好,你的手机会有代理来为你操作手机,然后还会有新的设备类别,我们会穿戴它们。 我会回答你的问题,我想说这些东西到底意味着什么?我们一直在谈论所谓的个人AI设备。当大型语言模型和大型视觉模型像我们一样理解世界,像我们一样理解我们如何交流时,我们很自然地会与那些靠近我们感官的设备互动,更靠近我们的眼睛,靠近我们的嘴,靠近我们的耳朵。 然后会有一些我们将穿戴的东西。眼镜非常自然,但还会有首饰、挂坠、别针,因为交互界面类型与以前在PC和智能手机上的非常不同。那将是一个新的设备类别。它们将是我们移动体验的一部分。 Kharpal: 你提到了关于大型语言模型的有趣之处,这指向了是什么改变了,使得当今设备变得更加个性化? 好的,这涉及多项技术,我来为你分解。我认为第一点是,那些大型语言模型变得相当好,而且它们也变得非常专门化。 Amon: 不仅是语言模型,还有视觉模型。你开始听到像“多模态”这样的词,意味着模型将接受不同的输入,将接受音频、语言、视觉。 你开始听到关于更小模型、专家混合模型的说法,它们针对某些功能非常专门化。你开始听到模型蒸馏,即有一个大模型被训练,然后你得到一个更小的模型,你开始听到这些模型连接到不同应用。 你听到像MCP协议这样的技术,即模型可以连接到互联网和其他应用、其他云服务。然后这个技术组合的最后一部分,我相信你听说过OpenClaw。 那些被称为编排器的技术,即代理为你操作你的电脑、你的设备,查看你的数据,查看模型,并为你完成任务。 当你把所有这些放在一起,就创造了条件,让我们开始改变我们的移动体验,你开始以我们将与代理互动的方式与移动设备互动。非常不同。 没有键盘,你不需要触摸,你只需要看和说,我认为这开始创造先决条件,让我们看到由AI带来的这场移动革命。 Kharpal: 所以,Cristiano,让我们解决其中一些问题。你谈到了模型,因为我们一直在大量讨论大型语言模型。这些巨大的、庞大的模型经过训练,然后支撑着那么多人使用的聊天机器人。 但也有讨论说这些模型中的更多变得越小,以便在设备上运行,而不是在云端。这是你在高通工作的一个重要部分。目前模型的开发在支撑你一直在谈论的某些代理式AI体验的未来方面有多重要? Amon: 看,这真的很重要,这些模型将继续被开发。但我认为我们现在正在达到行业的一个成熟点,开始理解这些模型和计算机将如何协同工作。 我要稍微挑衅一下,因为我记得大约一年前,也许两年前,一年前有很多讨论,关于这个模型是在云端运行还是在边缘运行。我能否在边缘设备上运行与云端完全相同的模型?但我认为那是错误的讨论。 举个例子,Arjun,如果我问你手机上有多少应用,你可能会告诉我大概超过200个,整理在文件夹里,如果我让你一个一个看,哪个应用的部分在云端运行,哪个部分在设备上运行,那可能是无用的练习。我知道它们都在两者上运行,因为如果你把手机调成飞行模式,它就变得不太有用了。 所以,我认为同样的事情正在AI上发生。 AI只是计算的一种新形式,模型现在以这样的方式发展,它们有特定的模型在边缘运行,有特定的模型在云端运行,它们将协同工作成为一个整体,实际上现在有个行业术语叫“计算连续体”,它将像一个集成系统,我给你一个例子,我的意思是什么? 如果我将要与未来的个人AI设备互动,比方说一副智能眼镜,我要像现在和你互动那样互动。我需要即时响应。我可能走在街上,我说“这个人是谁?”模型会说“那是CNBC的Arjun。你认识他。你可能想打个招呼。”我不能等。我不能刚问完问题,继续走,然后等着令牌过来。同样,如果我读菜单,我说这写的是什么?你想要即时响应。如果我扫描二维码,请帮我付这个。所以,发生的是计算自然地在哪些在边缘进行、哪些在云端进行之间分解,它们将集成。一个不能没有另一个运作,我认为这将在某种程度上定义我们如何看待AI时代的消费电子和设备未来。我要告诉你,这与汽车、机器人发生的情况没什么不同,实际上,那些是边缘AI的好例子,它们实际上在机器人中运行,在汽车中运行。 所以,让我们深入这个术语AI设备,它到底意味着什么。嗯,我们显然有智能手机,但在过去几年里,当然,所有这些不同类型的聊天机器人呈爆炸式增长。我们在想OpenAI的ChatGPT,Anthropic的Claude,Google的Gemini,所有这些现在都在。它们变得复杂得多。现在设备制造商在想,我们如何将所有这些AI整合到所有这些不同类型的电子产品中?最终,这对我们将如何使用设备意味着什么? 这部分真的很重要,因为我们即将讨论不同类型的即将推出的AI设备,你会听到诸如智能眼镜之类的东西。如果你没见过那些,你知道,Meta生产了一些智能眼镜,里面有个摄像头。三星、高通和谷歌都在合作开发智能眼镜。有很多公司在关注这个领域。很多人认为这可能是AI设备的一个新前沿。 我们这里还要提到的另一件事是AI别针。现在,你可能没见过这类设备,因为它们在2024年只流行了很短暂的一阵子。是一家叫Humane的公司把其中一款推向市场。基本上是一个小方块,你把它别在衣服上。它有一个摄像头,没有屏幕,但你可以跟它说话,它会给你答案,还会把文字投射到表面上,比如你的手或桌子之类,它配备了AI。 这个项目实际上失败了。它得到了一些相当差的评价,你可以读到所有关于它当时未能流行的原因。但它让人们窥见了设备公司在AI世界中看待设备未来的方式。我们现在开始看到越来越多的非传统设备公司涉足消费电子领域。 一个例子是ChatGPT的制造商OpenAI,他们聘请了著名苹果设计师Jony Ive来开发一款设备,所以当那款产品亮相时会非常有趣。但这也表明,新的参与者正在进入这个消费电子市场,我们可能会看到我们从未见过的新设备形态。 现在一个巨大的流行词,我们已经提到过,就是这个Agentic AI的想法。 现在当我听到人们谈论它时,那种乌托邦式描述实际上是,这些AI系统将能够自主地代表我们做事,就像最聪明的个人助理一样。 Kharpal: 当涉及到消费设备上的代理式体验时,在你看来那是什么样子? Amon: 好的,这实际上是我喜欢回答的问题之一,因为你知道,尽管我们一直在改变高通,我们正成为一家更加多元化的公司,但我们仍然是移动技术最大的提供商之一。 现在看到那些代理和手机上发生的事情非常吸引人。 当我们谈论代理时,我有点确信2026年将是代理之年,我们开始看到这正在规模化。 这些事物变得非常流行并在互联网上病毒式传播,我认为是在OpenClaw推出的时候,你现在有这个东西安装在你电脑上,你让代理为你做事,你创建代理,它去访问你的数据,代表你做事,为你操作机器,去互联网。 然后你看到发生的是,我记得人们去买电脑,很多人买Mac mini,都卖光了。他们把它放在办公室里,安装OpenClaw,让它一直运行,疯狂消耗令牌,连接到他们的Anthropic账户和OpenAI账户,消耗所有令牌。 现在,它展示了一条我们与电脑互动的方式。 我们将使用我们的电脑,但代理将代表我们使用我们的电脑并为我们做事。 现在在移动环境中,你不可能背个背包,放块汽车电池,放个Mac Mini,再带上手机。所以这些事情将在手机中发生。我认为这也将定义,鉴于有数十亿人使用手机,手机体验将如何发展,所以现在我们清楚什么是AI手机和AI PC。 那么,我来为你分解。将要发生的是,你的手机将具有双重角色。你的手机将继续是你的手机。手机不会消失。你拿出手机,你打开应用,你做那些事。但手机也将拥有那些编排器,那些爪子。从现在到夏天之间,你会看到每个操作系统供应商都在谈论他们的操作系统将有一个编排器和一个爪子。你将能够让代理为你做事,它将代表你操作你的手机。它去你的应用。你给它们指令。 这种变化非常深远,即使我暂时离开手机,我只告诉你软件公司发生了什么,整个SaaS行业,现在软件公司开发软件供人类使用,有人机交互界面,但也供代理使用,让代理进入他们的软件做事,这种演变方式非常迷人。 例如,你会有自己做的事,但也会有代理为你做的事。 我看到一些例子,某人有个会议,然后另一个邀请出现,会说“Cristiano,你有这个和CNBC的Arjun的播客,这个会议在这之后是否优先?”我会说“当然优先。”然后它说“好的,我可以为你重新安排另一个会议吗?”你说“可以。”代理会打电话给那个人,如果需要与人交谈,会发邮件,会基于你的日历找出如何重新安排事情。 慢慢地我们会习惯这些新体验,随着时间的推移,你的手机将同时做这两件事:由代理操作,也由你操作。 我就等着一个能帮我清空收件箱的代理。那是最棒的事。 Kharpal: Cristiano,当你展望路线图时,你说2026年将是代理之年。感觉过去两年,很多智能手机公司一直在谈论将AI整合到他们的设备中,但实际上没有一个是你在描述的这种代理式体验。你真的相信那会在2026年发生吗?到什么程度,我想,然后随着你与所有设备合作伙伴的合作,那变得更加先进的路线图是什么? Amon: 有趣。如果你记得从功能手机到智能手机的过渡,那是一个巨大的转变,手机变成了一台电脑。发生的是,在智能手机早期,非常早期,你拥有的应用是来自OEM的应用。 所以我确信当你买iPhone时,它带有iTunes,带有那个你可以移动鼓和乐器并演奏的应用,但最终发生的是应用商店出现了,开发者开始编写各种不同的应用,我可以告诉你,现在你手机上绝大部分体验并不是来自操作系统本身,不是来自OEM,而是来自开发者。它是一个平台,是一台电脑。实际上智能手机是人类有史以来创造的最大平台。 好的,现在让我们与AI做个平行。AI发生了。我们看到的第一个应用是聊天机器人。人们进去,问问题,得到答案。然后他们开始做更高级的事,比如总结这个给我。然后很多OEM说,我如何将AI应用到我的相机?我如何将AI应用到这些不同的功能? 混合了一些可用性。有些东西非常有用,有些则是早期阶段,但然后发生了一些事。 那些编排器和代理出现了。 然后一切都开始改变,因为现在AI可以变得非常有帮助,AI可以为你做事。我认为我们正处在这个拐点,这就是为什么我说2026年是这些事开始清晰、这些代理开始规模化的年份。 以至于从现在到夏天之间,你会看到每个操作系统供应商都在谈论他们将如何将这些编排器内置到操作系统中,因为代理就是新的应用。那些编排器就是新的应用商店。我们将在同一设备中看到新旧共存,因为在手机的情况下你只带一个设备,你不会带两个。 然后我们将看到其他类别的设备,它们只是代理,没有传统负担,比如智能眼镜、个人AI设备和别针。 我认为这就是我喜欢画这个平行关系的原因,因为它从OEM或操作系统如何添加第一方AI能力,变成了我认为无限的可能性,因为人们创建自己的代理,代理开始代表你操作设备。 我们待会要讨论那些新类型的设备。但我第一个问题是在那个回答之后,这是否意味着应用死了? 它们没死,但应用会改变,绝对会改变。 我要回到我两年前说过的话。我们都有银行应用,你有一个银行应用。 你有你选择的银行,你有那个应用。所以,有一个开发者,该开发者想象这个应用将如何让大多数银行用户喜欢。什么颜色,适合你设备屏幕。它会有手册,你启动应用,它会说“这是我的支票账户,这是我有多少钱,这是我最近的交易,这是我的信用卡,这是我的投资。” 完成的方式将是大多数人所喜欢的方式。 好了,现在你手机里的那个应用,你的银行应用,有你的凭证。所以,它可以去银行,作为你的代理进行身份验证,并把信息带给你。 现在,你可以有一个代理,你可以给它你的银行凭证,而应用的方式,同样的应用体验。我来给你描述。 你会说“我的支票账户里有多少钱?”它会说“这是你有多少。这是我最近的三笔交易。你能为我画个图吗?”然后如果你说“我想要这些信息显示在我的屏幕上,但我不喜欢应用的颜色,我想要不同颜色”,它会为你渲染。 所以,这就是区别。这是应用如何演变成代理的根本区别,它们将变得更强大,更定制化,并将集成到一切中。你可以在餐厅里,你看着带账单的二维码。我会说“帮我付这个。请从我的支票账户扣款,完成后通知我。”那将与你打开应用自己完成过程不同。 在你到目前为止在这一集里说过的许多重要事情中,你相信智能手机仍然至关重要。 Kharpal: 你是否相信这仍将是Agentic AI世界的核心,你期望我们与智能手机的关系将如何改变? Amon: 既是也不是。所以让我稍微退后一步,谈谈我们的数字生活,特别是从消费者的角度来看,将如何运作。 我们当前正进入一个世界,我们数字生活的绝对中心是我们的智能手机。我们最不可分割的设备。一切都围绕智能手机。就像智能手机是太阳,每个行星都围绕智能手机。甚至到了这样的程度,所谓的智能穿戴设备,它们的任务是把手机的功能延伸到你的身上。 举个简单例子,智能手表。它会给你时间,将传感器数据从你发送到手机,并从手机返回通知给你。它如此集成,以至于你看到行业实际运作方式是,同一家手机公司实际上也在做很多穿戴设备及其生态系统。 现在有个大变化。 在未来,非常近的未来,特别是当代理开始规模化时,你数字体验的中心是你选择的代理或多个代理,现在一切都围绕代理。 手机围绕代理,新类别的设备,我们马上会讨论,也围绕代理。代理将是那个理解人类意图并为你做事的存在。 所以,你的数字生活的重心发生了转变。那将改变我们与设备的关系,随之,我要回答你的问题。 手机会消失吗?绝对不会。手机是非常有用的设备。智能手机的规模巨大。但我们会以稍微不同的方式使用我们的手机。 记得智能手机出现时,有些人说笔记本电脑死了。绝对没有。笔记本电脑从未死。笔记本电脑还在,而且仍然强大。但你在笔记本电脑上工作的方式改变了。工作负载转移了。我喜欢提供这个例子,因为它容易理解。我们开始在笔记本电脑上做电子商务。我们开始在笔记本电脑上做社交媒体,那是你上Facebook的地方。 现在,大多数电子商务和社交媒体是在移动设备上完成的。所以,你的手机仍然会在那里,但某些工作负载将转移到新类别的设备,因为对代理来说与你互动更好,对新设备来说对你也更好。 所以,总结一下。你的手机仍会在那里。你的手机会改变。它会有更多的计算能力,因为你现在做手机的事,但你会运行代理来为你操作手机。 然后你在手机上的一些体验将迁移到新设备上,这些设备更容易用人类语言和视觉与你互动。 那么,让我们谈谈那些设备吧,Cristiano,因为你在对话中提到了几个,也许我们应该从眼镜开始。因为,你知道,这是你和谷歌、三星一直在合作的项目,我们知道三星今年会推出这些。你认为眼镜会是最重要的下一个设备吗? 100%会。看,数字本身会说话。我们现在每年出货数千万副智能眼镜。我们有预期,几年内这可能会达到数亿副,并可能与智能手机一样大。智能手机,你要知道,大约每年12亿部。 而它之所以成为明确赢家的原因是,首先,人类戴眼镜,我们中有些人戴,所以你已经有了规模化的眼镜行业。 第二件事是,眼镜非常适合放摄像头,因为当你转头时,摄像头看到的就是你看到的,所以,看到我所看到的。它靠近耳朵可以放扬声器,靠近嘴巴可以放麦克风。它将能够读取你读的东西。所以,眼镜变得非常自然,让你与模型、多模态交互,我认为是自然语言和视觉。然后很容易理解某些低摩擦的工作负载如何轻易迁移到眼镜上,我们开始规模化。 回到我之前说的,关于在以智能手机为中心的世界里可穿戴设备的作用,以及在以代理为中心的世界里可穿戴设备的作用。 很有趣。当第一款智能眼镜推出时,它的任务是拍照并发布到Instagram或生成Instagram故事。它基本上是你智能手机摄像头的扩展,还能让你听音乐。仅此而已。但现在你有了代理,每周你都能获得新功能。每周你都能集成另一个云,它的发展完全独立于手机的发展。我认为这正是我们所描述的,而且我正如你所知非常看好眼镜。 现在,早期的一波眼镜专注于配备摄像头,但有很多讨论关于让眼镜有屏幕,增强现实风格,混合现实风格的显示,以及通过手部动作和各种方式控制眼镜的能力。你认为未来几年智能眼镜会有哪些重大创新? 是的,你刚才说的那些。首先会有不同的类别和价位。我认为最基本的是模型能够消费和查看图像和音频。但然后我们开始看到很多有趣的技术,用于在眼镜中为你显示信息,我相信那将变得主流。 所以,我认为第一点是如何获取信息?如何获取文字?如何获取方向?如何叠加信息。有很多关于显示、投影的非常有趣的技术,我认为那将变得主流。另一件事是你将如何运用一些技术,其中很多是我们为虚拟现实眼镜开发的,比如追踪你的眼睛和追踪你手部周围的不同东西,这将为你创建控制点,特别是当有图像显示回给你时。 Kharpal: 你在这场对话中提到的另一个设备,Cristiano,是别针。我想几年前有一个别针的病毒式时刻,它失败了。是太早了吗?还是对这种设备没有需求?这种设备有未来吗? Amon: 是的,我想我们现在都知道答案了。它早了,因为那是在GenAI之前,在编排器和代理之前。但现在你有了它们,你可以看到它的价值。但公平地说,除了眼镜,其他形态尚未确定。我认为会有很多不同形态的试验。我们一直在与每家云公司和AI公司合作。我们现在有超过40种这类设备的设计,我告诉你,形态类型非常广泛。你会看到首饰。你会看到带摄像头的耳塞。你会看到挂坠。你会看到别针。你会看到手表。你会看到人们携带的其他东西。我们将看到这如何演变。但原则是,你穿戴的东西,一直伴随你的东西,可以看到你周围世界的东西。这样你就有了上下文,并且能够访问代理并与代理对话。未来几年内,我们肯定会在市场上看到所有这些设备,我们会看到人们想要什么。 Kharpal: Cristiano,我知道这是个公开的秘密,你们正在与OpenAI合作开发他们的设备,我知道你能说的不多,但这突显了那些以前不涉足消费设备的非传统公司,如何在思考AI时代的消费设备。你提到你有所有这些不同设计在进行中。展望未来,你是否预期更多通常不在消费电子领域的公司会进入这个领域,因为他们看到了AI设备的机会? Amon: 100%是的。让我解释为什么会发生?我会触及我之前说过的一点,Arjun。记得我告诉你,当智能手机处于你数字体验的中心时,更有利于垂直生态系统。同一家公司提供手机和所有可穿戴设备。 但现在当代理或代理集合是生态系统的中心时,你可能会有横向玩法。你可能会有多个设备,因为它们松散连接,因为它们连接到代理。这为许多公司进入这个领域创造了机会。 事实上,当你看人类购买的眼镜,那些是时尚设备。那些时尚公司正在变成科技公司,它们不一定是消费电子设备。我想回到你关于为什么那些公司要这么做的问题。 当我们经历这个转型时,先是模型训练和AI进入数据中心。然后是生成令牌的推理。但现在,你有代理来产生对令牌的需求。 那些公司意识到,随着代理的兴起,AI将由人类使用。并不是那些人类会去数据中心按门铃说给我些AI。 所以发生的是,我们穿戴的所有设备都成为代理的端点,那些AI公司明白他们必须赢得代理的端点。 还有最后一部分数据,没有人谈论它,但我们会在几年后记得这次对话,当人们开始谈论它时。 我们今天有AI的原因是因为我们将所有信息数字化了,我们所有的书,我们写的东西,电子邮件,互联网上的东西,社交媒体帖子,所有这些信息,网页都是数字的,现在你可以训练模型。 但一旦我们每天开始使用代理,我们开始戴着智能眼镜走来走去,看到我们所看到的,那数据量是巨大的,比我们用来训练模型的数据呈指数级增长。所以那些公司想要访问数据,因为这对训练未来模型和为你提供上下文很重要,因为你的消费者体验将是定制的。 所有这些都指向为什么那些公司对做设备感兴趣,我们非常兴奋我们做的所有芯片,从低于2毫瓦的耳塞到2000瓦的芯片,当我们进入数据中心时,对所有这些公司都变得相关。 Kharpal: 对。我想稍微谈谈芯片。不是吃的薯片,你知道,取决于你在英国还是美国,那意思完全不一样。 但我想谈谈一个术语叫SoC,或系统级芯片。 现在,这实际上是一块硅片,上面有各种不同类型的芯片。你会听到Cristiano Amon提到其中一些。所以,我想快速说明它们是什么。第一个是中央处理器或CPU。这实际上是一个设备的大脑。它处理所有通用计算任务,比如运行应用和系统。 第二个是图形处理器或GPU。它渲染游戏或设备本身的图形。另一个叫做神经处理单元或NPU,它处理AI工作负载,所有这些都集成到一块硅片中,然后塞进你的设备里,这实际上就是高通设计的。 然而,那是其他公司制造的,如果你听过之前播客的集数,我们谈了很多关于芯片供应链的问题。 但现在,整个半导体供应链中存在大量瓶颈。其中之一是内存。现在你的所有设备都有某种内存,笔记本电脑、手机。 发生的是,世界上只有很少几家公司能生产这种内存芯片。所有这些现在都被导向AI数据中心和AI芯片。因此,用于消费电子设备的内存严重短缺。这是目前所有电子产品公司关注的大话题,这也是Cristiano Amon和我讨论的内容。 这一切的核心是驱动这些设备的芯片,而高通当然是该领域的领先者之一。所有这些新类型的运行AI的设备的激增,对你们思考芯片架构的方式意味着什么?这种渴望在一个芯片上集成更多东西,让它们更强大、更节能。所以,当你考虑所有这些新设备时,这对未来芯片的设计方式意味着什么? 这对半导体公司来说是一个非常令人兴奋的时刻,对像高通这样的半导体公司来说。 Amon: 我们很荣幸,确实很荣幸,在移动行业开发我们的能力,因为移动行业非常严苛。每一代,用户想要更强大的手机,能做更多事,玩游戏,有大GPU、大CPU,但它仍然要能放进口袋,仍然要有全天电池寿命,仍然不能发热。 我没法在智能手机里做液冷和装散热器。所以这在我们的半导体工程中创造了一种DNA,你必须以高效方式封装更多计算,我认为这对高通这样的公司来说是个很棒的问题。 在眼镜上也是如此,我如何在眼镜中放入大量计算且电池非常高效。所以我认为这从根本上改变了架构,我们正在大幅增加神经处理单元的能力,这些神经处理器将运行那些较小模型,与云端的大模型协同工作。 这意味着硅的面积和专门用于运行模型的部分大幅增加。这既在GPU上也在神经处理单元上。 我们需要更快、更节能的CPU,因为代理驱动CPU。我们需要以智能方式管理连接和电池寿命。 我们的整个路线图现在都处于升级过程中。整个路线图。因为我相信我们今天拥有的设备都没有为这个未来做好准备。你将不得不升级你的手机。你将升级你的PC。你将拥有那些新类别的设备,如眼镜和挂坠。你的汽车将升级,你将能够在车里与代理对话,我认为这将发生在所有我们交互的东西上。这是一种新的计算形式,一种新的软件形式,需要新的硅架构。 Kharpal: CPU将有多重要?这将是迄今一个大争论,人们在谈论CPU的复兴,不仅是在数据中心,甚至在我们思考这些消费设备时。 Amon: 超级重要,100%正确。回到我给你的例子,当我们开始讨论代理时。你有大规模并行处理,如GPU甚至NPU,但那些编排器实际上处理非常复杂的任务。它们将检查你的数据,检查模型,去互联网,那是CPU在编排这一切。那些编排器在CPU上运行。所以现在,所有船都在涨,因为当我看到高通,我们的CPU变得非常重要,而且我们在行业中拥有领先的CPU,在手机、PC中,很快我们将在6月24日宣布我们的数据中心CPU。CPU将非常重要。 用于推理和高效功耗推理的NPU将非常重要,GPU也将继续重要。所以,这就是为什么我认为现在正是半导体行业的好时机。 Kharpal: 半导体行业正经历创新和需求的巨大爆发。随之当然带来了供应链的许多瓶颈,无论是在内存获取上,还是在芯片的实际制造上,从晶圆厂来看,也存在关于我们历史上在半导体行业看到的周期性问题是否正在改变的大辩论。你如何应对所有这些不同的挑战,特别是涉及内存和产能限制? Amon: 嗯,首先,在我回答问题之前,如果你有内存,我会向你买。好的。 所以,我认为行业现在正在不幸地应对类似我们在疫情期间经历的情况,我们需求远远超过供应,内存已成为瓶颈。 我认为我们的产能并非为这种AI现实而建,但我乐观地认为行业已经找到处理这些问题的方法,产能会建立起来。 我认为关于周期过程的问题,我感觉这有点不同。我认为整个世界的计算基础设施都升级了。整个计算基础设施。AI基本上是一种不同运行的软件方式。你需要不同且更强大的计算机。你产生的是令牌,那是AI世界的新货币,正如我在对话中说的,现有的计算基础设施不达标,需要进入升级过程。我们在数据中心开始看到的同样需求将继续,但随着代理站稳脚跟并开始规模化,也会在其他设备上发生。 我希望我们有更多内存。我们一直在与行业合作以获得更多产能。半导体制造也是如此,但你知道,这是个好问题。 我觉得我很乐观,有人说到2028年才能解决,我觉得我更乐观。我认为在2027年的某个时候,或者至少在下半年,我们应该会看到更多产能可用,不同的架构将使内存使用更高效,这为像高通这样的公司创造了机会,它在功耗和内存使用上一直非常经济,构建边缘设备,以在数据中心做颠覆性的事,这就是我们想在六月底展示路线图时展示的。 随着半导体领域的所有创新和兴趣,带来了有趣的竞争量。我认为更多是在数据中心方面。你认为在消费电子方面竞争会如何发展?因为,你知道,我们在消费电子领域还没有看到大量新进入者。我知道苹果一段时间以来一直专注于自己的芯片用于其产品。谷歌在Pixel中有Tensor。三星当然是你们的合作伙伴,但也使用自己的Exynos芯片。你是否预期随着新设备上市,新形态出现,你可能会看到更多的竞争和新参与者? 这是个非常棒的问题,看,我无法预测未来,但我可以告诉你一件事,我可以预测一件事。我们在移动行业从2G到3G到4G到5G看到的变化,它变了。玩家变了,设备变了,我知道我们在这场对话中没有提到,但我们正在研究6G,这实际上是下一代无线技术,面向AI时代和那些新设备类别。 所以,我们现在开始看到的是,当我们谈论个人AI设备时,我们触及了这一点,我们现在看到的是,对移动行业感兴趣的玩家正在改变。现在所有AI公司都在关注作为端点的移动设备,并且他们在制造设备。 所以,我如今开始看到的一件事是,智能手机OEM和AI公司之间的联合,智能手机OEM和模型之间的联合,我实际上认为这个格局将非常不同,因为手机中的工作负载开始由代理和模型驱动,玩家将非常不同。所以,我认为这个行业将经历变化。我无法预测赢家和输家,但我可以预测变化,我认为很可能改变智能手机OEM、操作系统和代理之间的关系,那将改变。 在硅片方面,看,我们一直都有竞争。 我一直都有竞争,我认为竞争对这些行业一直很好且不可思议,这就是为什么我认为数据中心也会看到竞争。 我们遵循的规则,我认为高通独特的一点是,当玩家来了又走,我们在移动行业看到很多公司从英雄变零。我们留下了,我们留下了,因为如果你有正确的技术,如果你有领先的技术,总有你的位置。 今天的成功并不能保证明天的成功。所以,我们必须继续重新发明硅并创新,我认为这就是我们在移动行业和AI消费设备转型面前所看到的。 Kharpal: Cristiano,和你交谈我总是学到很多。这提供了很多思考素材,我很兴奋看到你在这一集中暗示的一些事情在未来几个月和一年左右出现。非常感谢你加入我。 Amon: 我的荣幸。和你交谈总是很愉快,Arjun,期待很快再见到你。
英特尔芯片代工达成一个“新里程碑”。 据MarketWatch报道,当地时间6月16日,英特尔宣布其18A制程节点的升级版本——18A-P,已正式进入"风险生产"(risk production)阶段。 所谓"风险生产",简单理解就是:制程工艺已经成熟到可以开始初步量产,但还没到大规模商业交付的阶段。这个阶段通常持续六个月到一年,英特尔将在此期间测试18A-P在不同芯片核心上的实际表现,为后续全面量产做准备。 市场分析机构TechInsights副主席Dan Hutcheson表示:"他们愿意进入风险生产,意味着他们已经准备好承接外部客户了。" 18A-P比18A强在哪? 18A-P是18A制程家族的升级版本。英特尔表示,与18A相比,18A-P在处理高强度AI计算任务时性能更强,同时功耗效率也有所提升。 更关键的是,18A-P与18A设计完全兼容。这意味着客户不需要从头重新设计芯片,可以直接在18A-P上继续开发——这大大降低了客户的切换成本。 值得注意的是,英特尔最初并没有计划让客户使用18A-P。但据Creative Strategies首席执行官Ben Bajarin透露,AI基础设施的大规模建设带动了对算力和芯片制造的强劲需求,这直接推动了市场对18A-P的兴趣。与此同时,英特尔也借助这一变体提升了芯片良率,并完善了工艺设计套件(PDK)。 Bajarin称这是"一次重大跃升",并表示英特尔"现在处于能够获取客户、并将这些客户引入英特尔代工厂的位置"。 代工业务:每季度亏损24亿美元的“出血点” 这一进展之所以备受关注,根本原因在于英特尔代工业务的财务压力。 Bajarin直言,英特尔代工部门"一直是持续亏损的业务"。数据印证了这一判断:今年一季度,该部门运营亏损高达24亿美元。 华尔街目前对英特尔财务扭亏的押注,主要集中在其下一代14A制程节点能否吸引到外部客户。但18A-P的进展提供了另一条路径——如果能成功拿下客户,Bajarin认为这将对英特尔的营收和利润率带来相当大的上行空间。 Dan Hutcheson也指出, 考虑到芯片制造商当前必须以极快速度响应客户需求,18A-P的进展是"英特尔复苏的关键里程碑"。 他还补充,英特尔在EMIB(嵌入式多芯片互联桥接)芯片封装技术领域同样处于领先地位。 内部验证已完成,外部客户是下一关 在宣布18A-P进入风险生产之前,英特尔已有一定的内部验证基础。 据Bajarin介绍,今年早些时候,英特尔推出了首批基于18A节点制造的消费级和商用PC芯片,这些产品已对其制程技术和封装能力完成了初步验证。Dan Hutcheson也提到,英特尔已在18A-P技术上构建了内部产品。 但内部验证和拿下外部客户是两回事。"风险生产"阶段的核心任务,正是通过跨不同芯片核心的实际测试,证明这套工艺对外部客户同样可靠。这六个月到一年的窗口期,将决定18A-P能否真正成为英特尔代工业务的新增长点。
AI推理对昂贵DRAM的依赖正在松动。AMD宣布收购内存优化公司MEXT,将AI驱动的闪存优化技术引入数据中心。这标志着AI存储架构正在经历一场结构性迁移,而核心驱动力只有一个数字: 闪存成本仅为DRAM的1/55。 周一,AMD宣布以未披露金额完成对MEXT的收购。MEXT开发的AI驱动预测内存技术,旨在让闪存的行为更接近DRAM,在维持性能与效率的同时扩展可用内存容量。AMD表示,此次收购将扩充其AI产品组合,帮助数据中心客户提升性能、降低总拥有成本并加速工作负载部署。"对内存的需求正在企业计算的每个品类中增长,"AMD在声明中称。 收购消息刺激AMD股价周一上涨7.7%至550.75美元,市值逼近9000亿美元关口,当日S&P 500指数整体上涨1.8%。AMD今年以来累计涨幅已达323%。花旗上周五将AMD评级从中性上调至买入,目标价从460美元上调至575美元。 值得注意的是,苹果早在2024年就开始推进"LLM in a Flash"端侧方案。这一布局背后,是愈演愈烈的DRAM供给危机。据TrendForce数据,高带宽内存(HBM)已占全部DRAM晶圆产能的约四分之一,DRAM合约价格在2026年第一季度单季环比暴涨约90%。Citrini Research指出, AI存储需求已大到需要多层架构共同承接,闪存并非取代HBM,而是在容量维度承接溢出需求 ——这场架构重构正在重新定价整条AI存储产业链。 内存税危机:瓶颈从AI蔓延至全经济 据摩根士丹利分析师Shawn Kim团队本月早些时候的判断, 内存价格飙升和供应稀缺正演变为数字经济的全面风险, "从AI基础设施的瓶颈,蔓延至硬件利润率、设备可负担性、云成本、通胀乃至政策层面。"这一压力已有具体案例佐证:Xbox首席执行官Asha Sharma上周表示,内存成本在过去两年间上涨了约五倍,导致公司无法生产消费者所需数量的游戏主机。 HBM对DRAM产能的持续蚕食是这场危机的核心驱动。据TrendForce及三星、SK海力士、美光等厂商的披露数据,HBM在DRAM晶圆产能中的占比已从2020年的2%攀升至2026年预估的25%。超大规模云厂商以多年期合同预购未来晶圆产出,进一步压缩了面向手机和PC的标准芯片可用产能。 新增DRAM产能的建设同样面临结构性制约。扩产依赖EUV光刻机印制更精细线宽,每台EUV设备售价高达约2亿美元,一座新晶圆厂的投资动辄数百亿美元,建设周期在顺利情况下也需数年。这一供给刚性,正是本轮短缺具备持续性的根本原因。 55倍成本差:闪存替代的经济逻辑 据Citrini Research测算, 闪存的每比特成本约为DRAM的1/55——QLC NAND约为每GB 0.05美元,DDR5 DRAM约为2.75美元,HBM3E则高达15美元。 这一价差的可利用空间,在于AI推理中最大的单一内存消耗——KV缓存(记录模型每次生成步骤中所有先前标记的上下文,长对话中可增长至数百GB)——对读取速度的要求远低于模型权重的解码路径。对于此类顺序读取数据,DRAM的速度优势大幅收窄,而闪存的容量优势则充分体现。 闪存的扩容路径也与DRAM存在本质区别。闪存通过垂直堆叠更多单元层来增加容量,依赖现有工厂已有的沉积和刻蚀工艺,无需新的光刻节点,不占用EUV资源。闪存控制器基于成熟的6/7纳米制程生产,远离正在制约先进制程的瓶颈节点。 苹果研究人员此前发表的论文"LLM in a Flash"提供了方法论支撑:通过将大语言模型参数存储于设备闪存、按需调取至DRAM的方式,可在DRAM容量受限的设备上运行超出其容量上限的模型,并在CPU和GPU上分别实现比朴素加载方式快4至5倍和20至25倍的推理速度。 两条路径:数据中心与端侧同步演进 AMD的收购聚焦数据中心场景。通过将MEXT技术整合至AMD数据中心产品组合,AMD寻求帮助企业客户在AI工作负载部署中提升资源利用效率并压缩成本。摩根士丹利Shawn Kim团队认为,尽管内存短缺持续,AMD在云端市场竞争格局上仍具结构性优势——"代理式AI驱动的CPU需求在结构上有利于AMD在云端市场份额的扩张。"花旗对AMD的乐观预判则更多基于其GPU销售与英伟达的正面竞争态势。 苹果的路径则落子端侧。"LLM in a Flash"方案将模型推理对昂贵云端内存的依赖部分转移至设备本地闪存,在降低云端运算成本的同时,为端侧AI应用提供可行的内存架构支撑。 据Citrini Research,两大路径共同指向同一结论: AI推理的内存层级正在重构,低频KV缓存、模型权重及端侧数据,将逐步从高价的HBM/DRAM下沉至NAND Flash/SSD层,形成多层次存储架构。 这一架构转变正沿产业链形成多层次的传导效应。据Citrini Research梳理,最直接的受益层是NAND原厂,高容量NAND、企业级SSD及QLC NAND为最纯粹的方向,包括SanDisk、西部数据、美光及铠侠。 SSD控制器层被认为持续性最强——让闪存真正接近内存体验的核心在于控制器、固件与NVMe架构优化,涉及Silicon Motion、Marvell等。CXL/PCIe高速互联层亦受益。
今日有色
微信扫一扫关注
掌上有色
掌上有色下载
返回顶部