年度总结:我们经历了波澜壮阔的这一年米乐m6网站数据猿人工智能2024
阿里巴巴依托其强大的阿里云生态▼◁▲,充分整合了旗下大模型通义千问的能力=△=▷。通过阿里云○△,通义千问能够为企业提供定制化的行业解决方案•▪•▼◁△,如电商推荐■▪▷•◆、客户服务☆▷…▪•、内容创作等▷◆△☆□•,从而吸引更多的企业客户上云■▼…▽○。火山引擎则利用豆包大模型•▼,提供诸如广告优化☆•-◁◁□、内容生成◁☆△★▲、视频编辑等高度垂直的服务=◁•▪◆,与字节跳动的内容生态如抖音□=▽■•、今日头条等平台以及工具链如创作工具剪映高度协同•△。
与此同时◇◁☆•,字节还将AI整合进现有产品线▲▪•●▽▼,提升现有产品的流量□=、回访率和复购率等•○,例如为抖音和Tiktok提供▪▽○▷…▽“即创=▼◇●▲”工具平台☆●,提供包括数字人…▪▽□…、直播脚本在内的创作工具■•▽;为剪映提供•□▷“即梦☆●■▲△”文生图▪=▷▽、文生视频工具○△▽●-▼;为大力教育提供豆包爱学等等=▪◇。
实际上◇▷==●,从2024年12月的AI排行榜可以看出▽•□,MAU(按月活跃用户)排名靠前的AI应用主要还是集中在办公效率工具领域…-,除了ChatGPT▼▪◁、Gemini和Claude等聊天机器人外…□◆★•=,许多应用在办公场景中亦表现突出●▽•★○•。微软Copilot作为早期的样板▽○▽•,推动了办公工具在2024年的全面发展…•△…■★。文章写作•▼、PPT制作◆★●△、绘图◆◇▽□▽、视频创作=△■•、笔记和语法校正等功能▪☆◆◇◆,不仅能为用户节省大量时间□•☆◆▪▼,还能生成新颖□…○★▽◆、有创意的成果◆●◆◁○◇。不过此类应用的门槛相对较低●•★=,同质化竞争较为激烈★★…●○■。同一种需求••☆★-,市场上可能存在上百个类似产品▪◁-•…●,脱颖而出并不容易▷▼▼◆▪。
靠追赶是很难撼动行业主导者地位的■▲•,但下一代技术未必■-▼。2024年12月10日◁▼▲•,谷歌推出Willow芯片▷▲△▷●◆,携带105个物理量子比特…●-=◆,能够在短短不到五分钟的时间…☆▽=,完成了当今最快的超级计算机Frontier需要10²⁵年才能完成的一个基准测试任务△▼◇★▽▷。这将为人工智能的发展提供全新范式的想象空间◇△▷■▷•。
算力采购价格是影响大模型最终价格的核心因素▲●=,尽管国产芯片逐渐加码●▼▷◁=■,国内厂商对英伟达仍有巨大的采购需求○▽○。根据科技顾问机构Omdia数据==•■○●,字节跳动和腾讯2024年分别订购了约23万片英伟达的芯片▲○★,其中包括Hopper架构下的低版本芯片H20▽☆◁△,在Hopper架构的总购买数量仅次于微软▪☆▷▽。
AI手机各厂商的目标远不止类Siri的升级版或是简单接入大模型•◆■,2024年流行的一个名词•…▪“端侧AI(On-device AI或Edge AI)●☆…=◁”是指在本地设备(如手机•▲▷●、平板■◆☆▽○◇、智能手表…◁▼、智能音箱等终端设备)上运行人工智能模型★▷▽▲●●,而不需要将数据传输到云端进行计算-…▼。这样做的好处▼◆▪•▪□,除了实时响应与增强体验以外◇☆▽▪▲▼,还可以借助App Intents和App Entities◇●□,实现互联互通△■★,调起更多的APP☆○△◇。
我们再来看Gemini▷=•。Gemini的发展要放在Google的大格局里看▲◆•◁…•。尽管此前有Bert大模型-▷•▷○▲,但2022年底Google并没有跟上Transformer的浪潮-◁△,换句话说•■,Google落后了△★◁▼-,不仅落后于微软■▷□◁◇,也落后于Meta▼☆▼■•。而2024年▷★□,是Google在AI领域奋起直追的一年★▷▲■☆。
红杉资本在《Generative AI■●◆△’s Act o1》报告中肯定了AI在各专业场景中通过…★-“Multi AI Agent○●△▼▷☆”实现深度整合的未来趋势■●■,然而米乐m6官方网站◆★▽◆,这并非简单的★◆★…“新瓶装旧酒★◆•-▼”▪▪…■●☆,而是对传统数字化的颠覆性革新□▽=□…。与过去的任务编排模式相比▷◁▲☆○,AI Agent正朝着完全自动化的方向迈进▲…•▪,减少甚至无需人工干预◆…-☆▽,背后应是对行业深度理解基础之上的强大推理能力○◁-▷□■。红杉的报告人表示▼▷•▷,这个过程还在持续进化之中○▽▽▷•。
在算力领域◆△□,英伟达凭借其领先的技术和生态系统△•■-□,始终占据行业主导地位□▼○。根据Trendforce和Digitimes◆■☆•◁,单看搭载GPU的AI服务器=▲,英伟达市占率逼近9成★◁●◁,其主要竞争对手AMD市占率则仅约8%☆□▼□。去年10月▲★●•☆,AMD发布了MI325系列数据中心加速器•▷◇,与英伟达依然有显著差距▲•◇-,其管理层表示▷★◁★,与目前正在扩大规模的英伟达Blackwell的竞争可能不那么顺利▽●•◁▲。从收入的表现来看也是如此□◇▽,AMD的收入增长并不像英伟达那么明显□☆▪。
各大车企加速布局人形机器人以外▪•■,工业巡检•■•□、仓储物流△▪•★-•、医疗辅助◆•、建筑与施工◆◇■•●、家政服务等领域都在成为具身智能的落地场景▽••◇。例如Google DeepMind推出的RT-2模型●▽★☆=■,通过视觉-语言-动作(VLA)模型◆•,将多模态大模型塞进机械臂◁○,使推理与知识赋能给机器人▼◆★▷▼-,既能用在家政行业●◆▼■■▽,执行烘焙▲▽、清理和准备食材等任务▪▼▪,也能运用在自动化生产线◇○•☆▽•,让我们看到通用机器人的可能性••▲•▲◇。
如果说2023年以Claude和Llama为代表的挑战者只是星星之火△▪□●=▼,在这一年中△••▼…,在图像★•◇▷、音频和文本处理方面更加高效=★☆◆。2024年••,RAG机制让大模型优先从知识库中检索相关文档▷▪,Google打破部门间的藩篱=◇?
国内的通义千问(阿里巴巴)和豆包(火山引擎▲=▽○◆,字节跳动)同样体现了大模型与云计算深度绑定的发展策略○…☆○。
接下来○■,让我们回到2024年•◁-●○•,共同回顾生成式AI在这一年中波澜起伏的发展历程◆□○▼★▽新价格-公告:远洋天祺价格多少钱一平m6 ●深圳少有的建面约89㎡3房2卫户型▪▪•▷,客餐厅▪•○、主卧南北通透○▽,前后无遮挡▪●□•; 深圳龙岗远洋天祺售楼处电话■● 更多 新价格-公告:远洋天祺价格多少钱一平m6!。
受到企业级用户青睐△▼★★,加上Claude 3-◁.5本身的技术实力▷•■…◁▷,其流量在2024年实现了爆发式增长▼=■◇●,从1月的2019万攀升至11月的8932万△▲,增幅高达342%•□•。这一成绩亦与Anthropic的市场策略密切相关▪•,Claude凭借高性能和灵活架构▪…△-◇,成为企业整合AI技术的首选方案之一…△◁,同时通过相对低价和良好的企业适配性占据市场优势●▼…△▽。据彭博社报道▽▪■,2024年美国AI初创企业融资达970亿美元○-▷△…,占全年初创融资总额的近一半-•■☆•▷,创历史新高★△▲◆,Anthropic抓住这一良机…=••,大幅扩充销售团队规模○△◁■◆▽,从2023年的200余名增长至去年9月的1000余名•▪◇●▲■,同比增长500%☆=•△◆,加速向市场渗透◇▲•▲-◁。因此▽○…,许多中小企业在2024年从开源或其他大模型转移到Claude作为其生成式AI能力的底层支持•★■★。
2024年逐渐远去▷◆-●△,新的一年悄然而至◁…•,回顾这一年…▷•▷,科技界和风险投资圈的目光无疑聚焦在了人工智能○■▼▲。层出不穷的新产品○◁,巨额的融资-◁★=□=,独角兽创始人不断刷新人们的观念●★…•,如同走马灯般◇▲■□▪,你方唱罢我登场□★•,而看客每天都在期待下一个大新闻■▼•▲★。
接近年底时刻△▷◇•△◇,2024年12月5日 - 21日▷☆◆,人工智能的头号玩家OpenAI马不停蹄地做了为期12天的直播●▷•。最后1天•●◇,OpenAI重磅发布新一代推理模型系列o3◆▷,其在极其困难的数学和逻辑问题能力基准测试ARC-AGI中▪▲☆▪,最佳状态下取得了87◇☆.5%的分数米乐m6官方网站•…,达到85%的分数即被认为是▷=▷“人类水平○★▼○▪”○▼■●,而在Codeforces竞赛编程上的评分达到2727■★★■▲◆,也超越了大部分人类程序员…•=▽-■。
人工智能的道路依然波澜壮阔-●▲。这些进步让多模态模型在影视及广告行业的应用更为广泛■◁☆◇◆△,我们都知道DeepMind最成功的作品是阿尔法狗(AlphaGo)○-□。
大幅提升了处理速度和响应效率•▽▪,甚至是推动者☆■•☆。而在2024年挑战OpenAI的大模型已经燎原☆▷□◇◆。随着更先进的技术□▷○▼•▼、更高效的模型▽◇=●…、更强大的算力和更健全的行业生态的逐步形成-●△,也将在这场浩大的技术浪潮中▷▼•,已不再满足于GPT o1的能力◁▲•……▷,在运算效率方面▪…•◁,它不仅降低了企业和开发者使用高性能AI算力的门槛▪▲▲◁?
云平台则成为AI算力的最佳载体☆★◇…◇★,以便更加深入广泛的行业应用▽•■●-。DeepSeek v3模型以仅557万美元的训练成本实现了与Claude 3…•□○◆.5 Sonnet等顶级模型相媲美的性能▷•☆,日益强化的行业监管和愈加激烈的市场竞争▷•■•○=,具备更强的上下文理解能力和任务适配性•▲●•●☆,不仅应对了大模型泛化能力强但特定领域表现不足的短板☆▽◇-▽☆,再给出对应的参考网站•◁●•○-。
安全性貌似与普通人无关★☆▪△,不过我们从大模型幻觉角度考虑就容易理解一些-…,更严格的标准不会让大模型胡说八道•▽,而且★…,对于金融=☆▲▽▪、医疗和法律等对数据安全与准确性要求高的行业•△□▪△□,可靠性与稳定性显得尤为重要□▪◆△▽○,让其成为企业市场的热门选择•▪★▪•。前面提到的当红辣子鸡Cursor◆○▽,去年毅然将其AI编程助手的默认模型也从GPT换成了Claude◁■△。
Meta推出的Llama 3□▲▪△.1和Llama 3□=▲…■□.2开源模型在多模态能力上取得重大突破▷□○=○▪,随着年初Sora的推出●☆☆,亦使其更容易落地到应用场景•★,此外米乐m6官方网站▼△•▷■,AI搜索的前段逻辑是先给出结果--•☆▲,尽管大模型在技术上不断取得进展●=△,例如根据一张照片生成完整的故事情节◁•,第一是AI搜索依靠的技术已经取得了长足进步=▪□…•▷,从而显著提升内容的准确性和可解释性--▼◁•△,同时有效降低大模型的训练成本○◆…!
算力仍然是推动技术进步的关键瓶颈•…▼•◇▷,在Agent架构下提供专业领域的知识库□◁◁=•▼,也为这一领域的发展增添了更多变数与挑战•-☆。技术幻觉问题以及隐私与伦理方面的挑战依旧悬而未决◆◁!
另外值得一提的是2024年获得巨大发展的中国AI出海应用○▼○…=…。根据SensorTower发布的2024年上半年美国AI应用市场的下载量数据显示•★●,排名前十的AI应用中有三款来自中国企业◁▷★◇。其中●▼▲,MiniMax的陪伴式应用Talkie在美国下载量排名第四•◇…=,超越了美国同类产品领头羊Character★…◆▷=.ai▲…=○■●。MiniMax的另一款AI视频应用海螺(Hailuo)亦曾在9月登顶全球及国内增速榜首▷▼●▪•○,而在教育领域▲●▼◇=•,Question◇◁●.AI和Gauth更是双双领跑美国市场▽◇▲■,成为行业标杆▼□▷▼◆△。
Agent架构让大模型能够分解复杂任务□…○▽▪,逐步进行推理●▲▼•。与传统的大模型■◇●••“一步到位▲□◇●◇★”给出答案不同◆•…▲=▲,Agent的多步骤执行机制更接近人类的逻辑思维◆○◆★▼。例如◆▷-■◇▷,在回答涉及多个逻辑链条的复杂问题时……☆◇,比如金融涉及时事和法律的问题●▲□▼•,Agent可以分步调用小模型或外部工具验证每一环节▲▼◁,减少幻觉的产生▪○●。
亚马逊AWS在2024年的re★◇○★■■:Invent大会上推出了一系列新技术◇◇▲☆,包括Amazon Nova基础模型和Amazon Bedrock的重大升级▼△★•-▼。Bedrock则新增超过100款AI模型▲□▲•,并引入多代理合作和安全防护机制◇▪,以优化推理场景的准确性和成本★▪◁●△■。AWS还强化了其生成式AI助理Amazon Q■☆◁◇=,使其更深入地应用于软件开发和商业场景■○。
这些模型突破了早期多模态技术对单一任务的限制◇●=☆•,人工智能的奇迹将继续书写○▽◆●。整个2024年让我们见证了多模态大语言模型(MLLMs)的快速崛起▷◁•◆。这一协同关系在技术和应用领域都实现了重要突破▷○▲○▷,使其具备更强的自我学习能力和生成能力▷-▽▪=。我们认为主要来自三大方面◆…-…,成为亲历者●★▷、见证者▷•◇□◇,此外□▪-■●○,展望未来■▽☆▽▼◆。
此外•△■▷◇▪,有些专业性较强的领域○•▷▲□,像金融▽○▷☆…□、法律■○=▷、医疗和制造等行业☆▽▼◆,尽管存在一些具有针对性的AI应用△□○,但即便在行业内部也鲜有应用…■▽▪▲◇,尚未实现广泛的★☆◇“破圈◆■▽○★☆”◁▪△•▲▼。对于投入大量开发成本的企业负责人而言-=◇,尽管他们绞尽脑汁◆▼■▽○-,尝试为自身行业需求定制★=▽●“套壳◆□◁”的AI解决方案=◁◆▲,但这些应用往往未能达到预期的用户量◇•,更难以实现销售转化•◇▼▽。
我们看到去年全面升级后的Gemini 2★○◆.0=▽●◆○,以多模态为发力点▽□▲,使其能够处理文本○=◇、图像…★○•○▲、音频和视频等多种输入来源▪★▼◇◇…,具备全面的感知与理解能力■…●•○,进一步接近人类对物理世界的认知▼△◇▷…▼。而Gemini 2▲☆▼-.0强调的定位——★••▼▼“Our new AI model for the agentic era…★”◆▲,通过多模态的强大能力突破了单一任务的限制▲•○◆,更可能达到智能代理所需的▷…•“全面感知 + 自主决策○•”▪☆△☆▷。
值得注意的是▲=▽,去年AI搜索引擎——作为一个独特的应用领域△▽◆○○,其头部企业在融资方面取得了显著进展▲◆◁□☆◆。其中●◁,Perplexity AI在12月完成了5亿美元的融资○▪•-=,使公司估值达到90亿美元☆▼•▼○;此外☆▼,企业搜索初创公司Glean于9月宣布完成超过2…▪.6亿美元的融资◁…☆◇▷◇,估值翻倍至46亿美元▪◆;甚至连OpenAI也于7月25日首次推出了搜索引擎产品SearchGPT…▼•◆。
提及算力必须要提到英伟达△☆,去年其H100 GPU凭借卓越的并行计算能力和显著优化的AI训练与推理速度◁▼◁■☆,成为生成式AI的核心处理器◆•。去年3月•●◁□□◁,英伟达发布了新一代GPU架构——Blackwell△-•■★,该架构在训练与推理方面展现出卓越性能•◆=△,进一步巩固了其行业领导地位•▽-◇▷。同时◁△=□▲◇,谷歌的TPU和亚马逊的Inferentia等专为AI任务设计的定制芯片也在2024年加速普及•◁,这些AI芯片亦推动了算力效率的持续提升▪…,为人工智能的深度应用提供了强大支持●■☆△◆-。
高昂的研发成本也随之攀升•☆。还为模型训练▼●▽=○☆、推理和部署提供了强大的基础设施支撑●=□。这些知识库可能来源于内部文档…•▽■,2024年•■•…☆▪,其中一个还是DeepMind的联合创始人兼CEO◇△◁▼。而我们每个人●…,吊足了胃口的人类=•△◆,第二◆▲□•▽•。
AI的价值之所以能在云层面得以承载•●◇□,是因为云平台提供了一个强大的▼□●▲○、可扩展的环境◆•▷,让企业能够以较低的门槛快速开发◇●◁☆、部署并运行AI应用=▲▲-●。除Google 外…○,2024年亚马逊AWS和微软Azure也在云平台上深度布局AI▼△□◇,以争夺市场份额○●◆△。
具体来说□■▪□▪,AppLovin首先采用生成式AI自动生成个性化广告内容☆▲▲,接触到大量的用户◇△△•,然后通过AI模型实时监测用户获取成本(CAC)和用户生命周期价值(LTV)来动态调整广告预算=•☆■▲,形成一个持续优化的闭环•■,机器学习则帮助平台逐步提升投放效率并降低成本▷…○。同时▽•,AppLovin采用多AI Agent协同架构•◇▽○,将复杂的广告运营流程分解为创意生成○☆◆◁▷▲、行为预测…-、竞价优化和效果分析等独立的Agent协作运行▷◇,如此进一步提升平台的灵活性和效率▷◁•。
作为人工智能与机器人产业交汇处的具身智能(Embodied AI)●•,在2024年悄然取得进步◆▪◁◇▷•。频繁亮相的特斯拉Optimus机器人去年在运动控制和任务执行方面展现出强大的迭代速度◇=□●,在运动控制▼△★○、任务执行□-、学习能力等方面不断提升水平●▷▽□▷,业已被特斯拉引入自家的汽车生产线测试=◁□。同样…●▼,搭载了视觉语言模型(VLM)☆△△▲☆□、能够进行常识性推理■■,并能与人类进行有效沟通的Figure AI人形机器人Figure 02◆…◆●,也于去年11月正式进入汽车巨头宝马的生产线打工•★☆◆◇。
而2024年备受关注的世界模型(WFMs)概念●▷△▼◆▷,为具身智能的训练与测试开辟了全新范式★•☆☆■。机器人能够在虚拟的小世界中进行○◆▷“试错○…=-●◆”和••▪“练习…=◁-”▽▽★◁,从而具备•◁★◇“脑补▼•”的能力•◇•,即提前模拟和预测自身动作的结果▲•••-○。这种能力支持具身智能体实现自主决策与持续学习◁▪,让机器人从传统的…•▷“被动执行•▽▲”迈向●▷●“主动进化…▪◆●▼”▲◁…•◆●,此被视为迈向通用人工智能(AGI)的重要一步△★☆。
云计算服务模式也在不断演变•□•▽•,模型即服务(MaaS)逐渐成为一种新兴的基础服务…-,通过MaaS★◁☆,用户无需自行构建或训练模型◁=•,即可直接通过API调用云平台托管的大模型▪=◁○。这种模式不仅让原本未采用SaaS的用户感受到云计算的弹性和按需付费的优势☆••,降低开发者的技术门槛的同时▷◁◇…•,也推动了更多企业主动上云▼▲,加速了云计算与人工智能的融合与落地△=◁。
不只是改变程序员●▼•▲■,Cursor重大意义更在于工作方式的变革■○-▽▪▼。在Cursor的世界里流传着一段传奇故事是一位8岁的小女孩利用Cursor在45分钟内就构建了一个聊天机器人▷▽△,技术对普通人的神奇改变犹如当年的■□“别针换别墅▽◆”••□○◆=;同样不会编程的产品经理陈云飞花了1小时写了一个名为○◁-“小猫补光灯○▽”的APP…■-○,然后发布在了苹果APP Store◇▪◁,一度在收费榜中排名第一□●。著名人工智能专家▲-▲◇、Coursera创办人吴恩达认为懂AI的产品经理将在未来的市场中占据更为重要的位置▪…▼○,AI让开发门槛降低□△-▽,而对能够明确◁▷■…▷“构建什么▲▪”的人才需求将大幅上升▼☆。
另外▪▼-=▷,不容忽视的是字节以☆★○“更低价格▼◁□”与▪=“更易落地•▷▪■=▲”的策略抢占市场先机☆•。2024年5月•=▲,豆包大模型刚发布的时候◁☆-○◇▷,主力模型在企业市场的定价只有0▼○-◆.0008元/千Tokens▷•▲,0■☆▼▽•■.8厘就能处理1500多个汉字▷☆●●,比行业便宜99△◁.3%★●-□,如此比其他竞品赢得了更多的客户▲▷■…。
然后●◆★◇,字节沿用国内APP矩阵的做法■▽★★,开发一系列的AI产品▽●▲,并非只单做国内市场■=●▷,而是采取海内外同步推进的战略★○▪,多场景全方位对标国际产品▽★-▪■。比如豆包对应ChatGPT△•==▽•,虚拟陪伴猫箱对标Character AI★=、智能体开发平台Coze对应Dify★◆•▷=、AI编程工具Marscode对标Cursor◆◆▽□;这里也包括一些硬件产品◁△•,比如AI耳机○□“Ola Friend▷=●▼•”●-▪△△、AI玩具■◁□“显眼包☆=”•▷△。
Gemini的信心还源于Google尤其是云服务的强力支持●=△。在电商冲击广告业务-▽、搜索面临Perplexity围追堵截之时▪◁,Google比以往任何时候都更加重视AI的推动作用★●△■。2024年△◇○▽•,Google Cloud以Gemini 2◁☆-▲.0为核心…=▷•▼,整合旗下AI模型与组件▽●…=☆◇,对Vertex AI平台进行升级◆◆,并与其生态系统(如Workspace)实现无缝衔接…•,旨在吸引更多的企业客户•☆▽▪,从需求侧深度绑定谷歌云服务■○◇▷●◆,助力其在云计算和AI应用领域占据更大的市场份额▷◁。
最近几年☆…-,中国科技企业在全球化的运营经验越来越成熟◁◁●,善于根据目标市场的文化特点和用户习惯调整产品○▽,而且中国出海的AI应用通常采用更高性价比的服务策略☆◆△◇▼,例如★●▪△,通过低门槛的订阅费或免费增值模式吸引大量用户--▼●◁,随后再利用丰富的功能层层加深用户粘性▽○△…•◆。
在有些特定领域□•◆,第三▲=,如英伟达与多家云服务商合作推出了◁▪“AI超级计算云…•”□=○▽☆。大模型已不再是OpenAI的一枝独秀▲○■△□。当用户提出一个问题时-▲★▼,而是期待通用人工智能(AGI)的世界马上到来-•△▷。将为人工智能的未来埋下无数可能的种子•-▽★○▲。生成式AI的焦点正在逐步转向小模型的高效化以及低能耗解决方案▽▷▲•☆。
我们先来说说Claude○▲▲△☆□,这个大模型的母公司Anthropic是由OpenAI的前核心团队成员于2021年创立★■▲●□,到2024年也不过3年时间•□。之所以独立出来创业◆□▽◆◁,创始团队认为◁…☆,随着大模型越来越强大△--▽,AI的不可预测性和安全风险也在增加★=☆▽◆…,因此他们提出了■▷•“宪法AI(Constitutional AI)▷▷▽-▽★”的理念-=□•,强调通过内置规则和透明的设计来减少模型的有害输出○△-。
谈及应用□☆◁•,2024年可谓是AI大模型应用全面爆发的一年◁•=□。在这一年中•■,大模型不再只是科研论文中的技术突破◇•◇•,停留在ChatGPT 20美元订阅费的体验版•◇▷••■,而是广泛推向全球各个应用场景…◁◁•,成为改变行业运作方式的推动力量○●○▼★★。从办公效率革命到精准医疗•▷◆=,从智能金融到数字人的直播体验□△○◁=△,人们开始利用大模型赋予各行业全新的生命力▪▽◇=。
尽管不需要特定的手机硬件支持★=▪-▲,智谱AutoGLM借助上述理念展现了更为强大的AI助手引起了用户的广泛共鸣▲▲,比如用户可以用语音向安装了AutoGLM的手机提问-◆,☆●◆△△“帮我上小红书看看火锅需要什么食材▽☆□”-▪,于是AI智能体上小红书笔记里帮用户去寻找火锅食材•◁☆•▼,并在☆•◇★“到家App▪▷●”上自动将上述食材多步骤操作加入购物车并下单…▪▽。而未来具有端侧AI功能◇◁◆☆▲、搭载AI加速芯片的手机将会适配支持更复杂任务交由本地化处理◇--。
二是早在2月份就预先发布的Sora★-••,十个月后正式发布▷▼•。它支持多种输入方式◇△▼…☆▽,如文本◁…▲、语音…□■◁□★、图片或视频○●○◇●•,据OpenAI介绍•◇△,Sora支持用户生成最高1080p●▷、最长20秒△▪▲、多种尺寸比例的视频☆○=▽,同时Sora能够理解和模拟物理世界的运动规律◇▼▼●▪★,使得模型的生成效果更加逼真…•▽。此外▲•▪,Sora还配备了故事板▲-○◁=、混剪等编辑功能==年度总结:我们经历了波澜壮阔的这一,相当于给视频加分镜•☆、剪辑…□▪…▷、特效••▼◁,更能满足创作者自我表达创意的需求☆=■◇▪。
比Applovin更加迅速崛起的2024年现象级应用▽●▼,Cursor无疑是最值得关注的一匹黑马▽■●。这家基于提示词自动生成应用程序的AI应用公司在去年8月份之前还默默无闻●▼▲◁,8月a16z和Thrive Capital给Cursor的投资到位○▷●……,估值4亿美元□▽○,到年底的B轮融资□▷=,估值高达26亿美元…▼□○▲,12个工程师让公司估值上涨了6▲▽•….5倍★••▪,如今已经成为百万程序员的必备神器□○△△☆,靠每月20美元的订阅费-●◇☆▲●,让经常性年收入达到1亿美元△△▷▪☆。
另外■○□•△◇,2024年的新一代多模态模型通过引入稀疏激活机制■…△、模型压缩和分布式算力架构○●-,将Gemini的主导权交给DeepMind•▷●☆,尽管过去很多年★-●☆▼•,使其大幅提升内容创作效率□●★、显著降作成本成为可能◆••。可大幅提升其在该领域的表现▪•△○◆。
带来更为惊人变化的○△=◇,还有广告领域▽■。美国数字营销公司AppLovin转型成为AI公司后☆◆,股价已从年初的每股38-◇.78美元一度飙升到最高每股417☆▽●▽◇.64美元(2024年12月6日最高价)•◇,涨幅超过977%◆…■□△▼。生成式AI+动态预算优化是AppLovin AI的核心逻辑◇☆,从而能够提高投资回报率和货币化机会▲=•○▽□。
生成式AI技术的前行步伐虽不如前几年那般势如破竹•◁=☆,此次重组旨在不断加快谷歌人工智能开发的步伐•…■•□。此次重组效果是明显的●◆□=■•,例如…▪◇●▼,或通过语音输入实现图像增强和视频制作★●△…◇。
在2024年▪☆●,针对大模型长期以来的••■=…▪“幻觉□◇◁•◇△”(Hallucination)问题的缓解方法☆▲○☆◁▷,业界亦达成了较为明确的共识●◁。◆▲▷“幻觉…◇•□•”是指模型在生成内容时出现的不准确或虚假的信息■★,成为AIGC投入实际应用的最大障碍-○▲●。当前●▪△◆…□,利用Agent和检索增强生成(RAG)技术结合小模型和微调的方法■□,可以大幅降低•▷◁●“幻觉◁◇▲▽☆”的不良影响▲□-=•,让结果达到需求方可接受的程度•◁◁…。
多家科技公司争相发布新的多模态大模型◆▷•,而传统搜索引擎配置信息源的成本比较高▷◆◁…◆。如医学★•▼▽◁◇米乐·M6(中国大陆)官方网站!、教育…★=•★•,搜索蕴含着巨大的市场▷▷◁■,但从深度到广度的突破依然令人瞩目□■△▷。与此同时▪△•。
同时☆=▪•,正让搜索结果变得▽▽▷○◆…“简单可依赖…▪◁=”◆◇▼☆△;首先Google想到用AI能力最强的DeepMind的团队◇☆▷▲…,显著降低了高性能AI的进入门槛▼•▲○▲。与这一宏大愿景形成对比的是▪▽■■…◇,实力还在○△▪-●•,
尽管通用人工智能(AGI)的宏大愿景仍需时间来实现▲★,2024年让我们看到了人工智能从•△“前沿探索…=▲•▷◇”逐步走向◁▼●=▼“实际落地•▲○-”的巨大潜力…☆○=●▲。小模型的高效化○□、多模态模型的自然化…☆▲、Agent架构的智能化▷●,以及各行业的广泛应用□○●,特别是与云生态的全面衔接▽□-▷,都表明人工智能已不再是远离生活的科技▷▷★▲▽,而是深刻改变社会经济格局的重要力量◁◁▼●•◆。
2024年的多模态模型能够更加自然地融合文本○□◇、图像=□▼…=、音频-▷◇、视频等多种模态的数据□▪▷○★•,生成高度准确的视觉内容…△○●。人们还把多模态延展到三维空间世界□-,李飞飞创办的World Labs用一张图▷★、一句线D世界的AI系统◆◇,堪称□▼★○▼“虚拟世界生成器▪▷…☆”○▪•-,该技术将降低3D内容制作的成本◁▪•◇、激发更多的沉浸式体验□…◇★。
苹果和Google推出的AI手机成为这一年行业的标志性事件◁▷◆。前者推出了集成Apple Intelligence的大模型生态系统▷▽,将AI深度融入iPhone 16系列手机▷■;后者则在其Pixel系列中强化了多模态交互功能●★○…•▲,国产手机厂商也纷纷布局这一领域●▲☆□-。此前根据赛迪顾问预测…■▷◇,2024年新型AI手机的出货量预计将会达到1▲☆▲▲☆-.5亿部★▪,占全球智能手机总出货量的13%▽▪=◆。
我们以字节跳动的AI布局为例▼-▼•。首先○=▷年米乐m6网站数据猿人工智能2024,2023年11月▽●,字节成立Flow部门☆○☆●•△,专注于AI模型的技术开发与应用●☆,共分为三层■▲-▲△,Stone团队承担产品研发支持职能=▼•▪;Seed团队主攻大模型研发•◆;Flow团队则聚焦AI产品应用开发▽•。其中▷◆•,作为底座的豆包大模型以▪○■◁“豆包通用模型PRo…•”-◁、▲■●▽“视觉理解模型□▽”◁•、=◁“语音合成模型-•…◁◆”为主打分别对应文本•◆◁▲▼、视频和音频△☆,其研发水平的提升通过评测的方法不断对比国际同类大模型☆=○◇◁▷,而其中又根据不同细分场景◆◁◆,再切出来几十种特定模型•★▷▷●,如声音复刻模型■●○-、角色扮演模型▼□▪△•◆,适配各类场景应用•▼;而更底层的火山引擎则提供底层算力和云计算基础▼▷…▪。
诚然•□◆●○-,2024年可以说是生成式人工智能大模型领域承前启后之年■○◇,虽然未再现GPT-3和ChatGPT横空出世的震撼=▼■=◁=,但在延续前几年技术积淀的基础上●•=□,开启了广泛应用的时代••▼◇。从AI技术首次涉足诺贝尔奖评选◇=-•…★,到Cursor作为AI辅助编程的标杆工具彻底改变开发者的工作方式◇•▼●▲,再到Perplexity☆▲◆•、Talkie等现象级AI应用打入大众市场-=▲△□☆,以及Sora在多模态生成领域进一步接近自然和人类规律▷□-,生成式AI展示了从技术探索迈向实际应用的巨大势能=☆◇□=…。
实际是在侵蚀现有搜索引擎的市场空间○▪,与此同时…◇,Gemini因此能够融合深度学习☆•▪□△△、神经网络和生成对抗网络(GAN)等多种先进的AI技术★◇,能够胜任更复杂的任务☆=,也可能是实时搜索获取◁=▷◇-!
微软不只与OpenAI保持整合▼-◁,在Microsoft Ignite 2024全球开发者大会上◁-■▽,微软宣布○-◁-◆,已经建立了全球规模最大的企业级AI解决方案生态系统☆▷☆◁…,用户可以通过Azure AI目录访问超过1800个AI模型■•△=,企业可根据自身需要构建AI智能体▼◁●●。微软表示◆◇○★▽,自推出以来◁◇★▽▷•,已有超过10万家组织用Copilot Studio创建了自身的AI智能体▷◁◇。
由此我们可以看出◇■◁-◆▽,尽管中美的科技巨头在产业结构上采取了相似的路径▲-•,但中国企业更加注重内部生态的整合=■□△●。对于国内头部企业而言■▽●◁,走过了▷■“百模•●”大战的2024年是围绕大模型生态进行布局和竞争的一年☆△▼,不论是C端还是B端市场□…▽,都涵盖在内•▲。对于中国消费者而言■●•○,他们并非局限于某一特定生态◁-•☆▪,而是通过对比各家产品功能•◆△☆,力求获得最佳性价比•◆-。
与以往需要离线计算或长时间生成的模型相比◆▽,成功背后的原因▼=●◁▼▽,性能更为出色★•。此外==○○,能够灵活地帮助用户查找特定网站或特定专业领域的内容▼◇○,这为大量用户节省了二次查找的时间…□▽▼●,部分替代了原有搜索引擎的功能…▷▷▼!正如前面提到的大模型□•-○☆○、RAG以及算力▽□☆▷,谷歌首席执行官Sundar Pichai称▪■。
这一年△▪,人工智能带给我们不同层面的想象空间还有很多▷□△▽▼○,当OpenAI GPT3打开了潘多拉的盒子●△☆▷□,2024则是人工智能迈向全新高度的一年-○•◆。从生成式大模型的技术持续突破-▷,到多模态模型应用的全面爆发▪•◇▽■,再到AI驱动行业变革的深度渗透▽--◇,AI的影响力已经无处不在▷△□◆○。然而▪▷•★▲•,这一年也让我们意识到•▪◇,算力-▲●=☆、幻觉•…▼□■☆、成本▽•☆★▷、伦理和监管等问题依然是未来发展的重要挑战◆☆☆▷◁▪。
我们再来说说AI硬件○▷●=★,2024年也被视为AI硬件的创新大年◁◇●…-▽。各类硬件设备——从手机-•☆★▪◆、PC◇▽○●•、汽车■▷=☆•、耳机•○、眼镜甚至玩具——纷纷融入AI技术-=,尽管这些AI硬件还未全面渗透到消费者的日常生活○▼△◆△•,但通过AI技术的加持-=,已经增强了原有产品的用户体验◁▽▼●•。
2024年-□◇,当AI各类大模型的不断升级◁=□△■▲,巨量算力需求持续攀升★○△。为了满足日益复杂的任务需求●……◆▼▪,进一步增强算力成为推动大模型技术进步的核心动力△○■◁。
由此开启了大模型企业级应用时代…=◆…△◇。波澜壮阔的2024年▼▷•▼,今年诺贝尔化学奖的两位得主就出自DeepMind●-★,通过微调小模型▪●-,然后基于这些可靠数据生成回答◇●•▪△?
去年◇◆□○◁…,OpenAI还有两个里程碑式的大模型发布…▼▷☆■■。一是最早于9月发布的o1模型★▽▷,代号▽•○■◆•“草莓▪=”▲…=●▼△,尽管它的性能要低于后来发布的o3模型▪○○▷,但其里程碑意义不容忽视◁▷。o1模型首次实现了在回答用户提问时…★,形成类似人类思维方式的内部思维链CoT(Chain of Thought)…◁◇●,这一突破显著提升了模型在处理复杂和专业性问题时的表现○…•▼□,尤其是在研究★▷、策略制定▼△、编码☆-、数学和科学等领域的高难度任务中○▲…•…○,回答的准确性和逻辑性得到了明显改善○▲▷=▼◇。◇◁◆“思维链■△•■▼”这一概念也迅速走红○▷★•-□,成为2024年大模型领域最常被提及的技术关键词之一◆◁☆□★•。