字节和快手混战AI：10余领域，从大模型到AIGC，谁更强？

2024-6-27 21:35| 发布者: 一灯| 查看: 319| 评论: 0

摘要: 抖音和快手都以短视频业务作为核心，更是在多个领域上，双方都有着相似的步伐，比如抖音做电商、快手也做电商；抖音做外卖、快手也做外卖。如今，当AI在国内大火之际，两家平台也都将目光瞄准在了大模型及AI产品上 ...

抖音和快手堪称国内最“密接”的欢喜冤家，在很多领域都是同场Battle。

两者不仅仅都以短视频业务作为核心，更是在多个领域上，双方都有着相似的步伐，比如抖音做电商、快手也做电商；抖音做外卖、快手也做外卖。如今，当AI在国内大火之际，两家平台也都将目光瞄准在了大模型及AI产品上。

对于AI这一块的投入，字节和快手的力度并不小。

字节于2023年成立专供AI 的Flow部门，并抽调了内部的高层管理和业务骨干担任该部门的相应负责人，其中前Tik Tok产品技术负责人朱文佳任部门的业务负责人、字节跳动产品和战略副总裁朱骏任部门产品负责人,字节跳动技术副总裁洪定坤担任该部门的技术负责人，三方协同合作推进AI进程。

期间仍不断有其他业务线的高管加入，譬如抖音社交负责人陆游、以及飞书产品副总裁齐俊元，先后加入Flow。

近日，外界在传字节旗下的大力教育业务zero本月底可能合并进豆包，合并后如果人员有冗余，可能伴随着优化。

笔者了解到，包括大力教育旗下的河马爱学在内的AI产品在今年年初就已经划归Flow。此外，不久前字节跳动推出的AI虚拟交友聊天平台"小黄蕉"（英文名Chatwiz），实际上也是挂在大力教育下，其产品初期只是一个语言学习数字人产品。

而为了加强AI战略，字节的其他部门也没闲着，包括剪映、巨量引擎、抖音主端、抖音电商、飞书等部门，都在加码各自的AI业务，成果陆续落地。

快手同样是在2023年年初，启动了新AI战略，结合并赋能现有业务场景，全面布局AI各种产品布局。在2023年Q3财报会议上，快手CEO程一笑介绍，快手的语言大模型-快意130亿和660亿大模型已达到行业内同等规模领先水平，同时也已经开始超千亿规模语言大模型以及多模态大模型的研发。

笔者了解到，快手AI主要由快手AI技术团队（注：此前的快手Y-tech部门）负责。快手AI技术团队拥有人工智能领域专利超过1千件，在北京、深圳、成都、杭州、Palo Alto多地均有研发团队。

快手AI开放平台是快手推出的AI服务平台，面向市场提供AI技术服务，产品服务涵盖计算机视觉、计算机图形学、自然语言处理、音频技术、视频技术、知识图谱、机器学习、AR/VR/MR、多模态等核心技术领域。

在产品落地方面，除了对标字节豆包的快意大模型外，还推出了可灵、可图等等各类AI产品，对标字节的Dreamini等产品。

从实际出发，快手和字节的AI产品的真实体验到底如何呢？笔者选取了几个热门赛道，进行了对比评测，以期帮大家明了各家在哪些领域布局，以及进展更快些。

10余款AI产品，字节和快手针尖对麦芒笔者根据公开资料以及掌握的信息，整理的有关字节和快手在国内AI各领域所推出的产品及功能图表。

注：根据公开资料以及鲸哥内讯整理并制图字节和快手的部分AI产品会有着相同的AI功能，这里选取双方在某个领域上更具代表性的AI产品进行对比测评。

大模型领域，字节更强，快手更稳

大模型是一切AI产品落地的技术基础，也是未来两家AI发展的助推火箭。

从团队看，双方都给予了AI业务高规格的待遇，不仅仅都有副总裁级别的高管参与，而且团队成员也都是从各业务线中抽调的尖兵。

产品方面，字节有着豆包大模型，快手则是快意大模型。双方的主要应用场景都位于对话场景。字节在2024年5月将国内外三只团队合并后，整合成豆包系列大模型，刚一面市就发起了价格战，颇有一种舍我其谁的气势，其对应的AI对话产品豆包App，也快速蹿升到行业月活前几名。

快意大模型则是应用于快手低调推出的大模型，相比很多已经过万亿的大模型，快意大模型还没有千亿大模型，但胜在踏实，每个模型的参数不算大，但是测评效果和多模态能力都不错。

笔者从最主要的是产品功能、对话逻辑等方面对这两个产品进行了测评。

产品功能方面，豆包的功能较多。除了基础的文字输入对话聊天外，还增加了通话功能，用户可以与豆包虚拟人进行一对一的聊天，另外，豆包还支持文生图、拍题答疑等服务，而快手的AI对话则只能进行基础的文字聊天，产品化进度比较落后。

对话逻辑方面，当笔者输入“快意大模型”的关键词后，豆包会给予较为详细的回答，而快手APP内的AI对话则表示不清楚。

注：左豆包APP，右快意AI对话功能

另外，还分别向两个产品询问“北京旅游攻略”的问题后，豆包会给予详细的规划行程，包括每一天的行程安排等，并给予注意事项，而快手AI对话仅提到一个不知名的景点，此后并无更多赘述。笔者还输入了其他日常用的较多的问题，分别对两个平台进行询问，从回答效果看，豆包大模型的回答要好于快手的快意大模型。

整体体验上，豆包大模型在对话方面的综合体验上较好。

AI绘画工具：字节明牌弱暗牌强，快手可图表现领先

字节和快手在AI绘画工具上都有着尝试，从产品数量看，字节的AI绘画工具较多，比如今日头条的AI绘画功能，抖音的即梦，以及抖音星绘，快手则是可图。

从产品相似度看，星绘和可图更为接近，所以这里主要比较字节的星绘和快手的可图的工作能力。

可图和星绘的功能很像，不仅都拥有AI分身创作服务，也都拥有文生图功能。

AI分身方面，可图和星绘各有千秋。可图支持动漫分身创作和单人写真，分别有8大动漫主题和4个写真主题供用户选择，用户在上传人物照片和选择主题后，即可生成对应的AI照片。而星绘则更倾向于开放式创作，除了类似可图那样已经备好的主题和模板外，用户也可以在上传人物图片后，输入提示词，去生成AI分身，但时间在1分钟以上。

文生图功能则是这两大产品的又一项重大服务。但从效果看，可图更胜一筹。当输入“西瓜”的关键词后，并选择默认主题后，可图生成了四幅不同，且视角不一的AI图片，而星绘则是生成多幅类似，且视角唯一的AI图片。随后，也试着输入火锅、小鸟，以及复杂的提示词，从最终的效果看，可图也都较为符合。

注：左为快手可图生成效果，右为抖音星绘生成效果。

整体上，可图较符合大家的创作需求。但未来预计即梦将成为字节的主要AI视觉生成产品，毕竟这款产品是原抖音CEO张楠带队。

AI社交：字节重视，快手浅试

AI始终都是互联网的必争之地，随着AI的出现，AI社交成为了重要的赛道，腾讯、百度、阿里、美团、字节、快手纷纷推出了自己的AI社交产品。

其中，字节的AI产品为猫箱，以及内测中的小黄蕉，快手也有一款，笔者独家了解到，快手的AI社交产品名为“快崽”。

这些都是AI角色聊天产品，用户可以与个性鲜明、背景各异的 AI 角色实时聊天互动，或是闲谈生活日常，或是进行深入交流，或是演绎剧情故事。

这里以猫箱和快崽作为对比，来看下字节和快手在AI领域布局的殊途。

从产品功能看，两者都支持创建不同背景的虚拟角色。但字节猫箱所创建的虚拟角色更有质感，不仅可以选择绘图风格，还可以对角色进行配图，以及增加语音功能。

此外，在生成虚拟角色后，还会自带虚拟角色形象的聊天背景图，使整个聊天更具沉浸感。快手的快崽在创建虚拟角色的过程中，则没有这些细致的步骤，仅需输入名字、性别和角色设定即可创建一个虚拟角色。

社交对话质量上，猫箱的虚拟角色在对话上，更具趣味性。比如，在这两个产品上创建同为淑女设定的虚拟角色，并分别进行相同话题的询问，猫箱会主动规划接下来的故事场景，并寻求建议，容易让用户掌握聊天的主动权，进而发展故事脉络的走向，而快崽则偏向于询问式的聊天，让用户处于一个被动聊天。

注：左为猫箱，右为快崽。

另外，猫箱还多了一个创建故事的功能，用户可以创建多个虚拟角色与自己进行互动，提供了更加真实和自然的交流感受。

AI剪辑：字节剪映更成熟，快手快影更丰富

AIGC最重要的应用场景之一是短视频，字节和快手两家同样在AI短视频创作领域进行了加码。

目前，字节的剪映和快手的快影，纷纷推出了各自的AI功能。

剪映的AI功能主要包括智能剪辑、语音识别和自动字幕生成等。它可以自动识别视频中的精彩瞬间，并将其剪辑成一个完整的视频。同时，剪映的语音识别功能可以将视频中的语音转换为文字，并自动生成字幕。此外，剪映还提供了一些一键成片和AI数字人的能力，算是比较成熟的AI剪辑产品。

快影的AI功能则主要集中在视频剪辑和特效制作上。它可以自动识别视频中的人物和物体，并进行跟踪和剪辑。同时，快影还提供了一些AI特效和滤镜，可以让视频更加炫酷。此外，快影还支持AI一键成片功能，可以根据用户选择的照片和音乐，自动生成一段视频。

从功能丰富度看，快影虽然AI功能居多，不仅有文生视频、文生图等主要功能，还有AI动漫、AI照相馆等十余个功能玩法，剪映的AI功能则较少，包含AI商品图、AI特性、AI作图等。

当然，AI在剪辑工具的最重要的一个指标还是成片的质量如何。笔者将同一视频放进这两个产品中，并使用AI成片的功能。从成片效果看，两者的体验没有太大差距。

注：作为快影，右为剪映。

总的来说，剪映和快影的AI功能都非常强大，可以帮助用户更加轻松地完成视频剪辑和制作。但它们的侧重点略有不同，用户可以根据自己的需求和使用习惯选择适合自己的软件。

视频生成大模型：字节努力，快手惊喜

自海外的Sora爆火后，文生视频成为了国内AI玩家的重头戏，字节推出了PixelDance, MagicVideo, AnimateDiff-Lightning等算法模型，并落地视频生成产品即梦，快手则是在近期上线视频生成大模型产品可灵。

字节和快手对视频生成大模型都非常看重。例如，视频生成产品“即梦”，是抖音前CEO张楠亲自挂帅的剪映所推出的产品，即梦的视频生成技术来自PixelDance。可灵为快手AI团队自研，基于快手在视频技术方面的多年积累，采用类似Sora的DiT技术路线，结合多项自研技术创新，效果对标Sora。

即梦和可灵都支持文生视频和图生视频两种模式。

以文生视频为例，输入相同的文本后，需要等到1-2分钟左右，方可生成视频，不过两者的视频时长不一，即梦和可灵分别生成了3秒和5秒的视频。最终呈现的内容质量，如分辨率、帧率和内容效果都大差不差。

值得注意的是，即梦囿于视频大模型应该不是Di-T架构，在语义理解和视频生成上都略差意思。而可灵在更多生成场景中表现优异，并且在生成时长方面更具优势，近期已开放视频续写功能，最长可以生成3分钟左右的视频。这在国际中都算不错的成绩。

发力更多AI领域，抖快从地上打到了天上

笔者独家了解到，字节在AI领域的进展正在加快，且应用领域也在拓宽。

比如，抖音正在测试一个名为AI分身空间的功能。这是抖音创作者与抖音合作生成的AI分身，基于创作者提供的人物设计、知识库、声音、形象等素材而生成。

注：AI分身空间功能。

AI分身可在创作者设置的场景中与用户互动：如抖音创作者已开启AI互动空间，用户可以通过点击他的个人头像等方式进入AI互动空间，与创作者AI分身互动；如抖音创作者主动在用户与创作者的群聊内添加他的AI分身，用户作为群成员可与他的AI分身对话和互动。

该功能基于生成式人工智能技术提供对话及互动服务，AI分身输出的内容均由AI生成，非创作者本人回复。

此外，据了解抖音的AI创作平台即梦也将推出音乐生成功能，打造国内版的Suno，目前正在招募测试者进行测试。

快手也同样加码了在AI音乐方面的能力。笔者独家获悉，快手旗下的K歌APP回森，推出AI美音功能，可以让用户唱的歌曲，通过智能修音，获得更好的K歌体验。该功能已经成为回森的一个重要功能专区。

注：回森的AI美音功能

随着时间的推移和AI在各领域的开花，字节和快手在AI上的交锋还将继续，谁又能拔得头筹呢？

收藏分享邀请

上一篇：突发！OpenAI停止不支持国家API，7月9日开始执行下一篇：普通人如何利用AI创业？这5大秘诀值得收藏

字节和快手混战AI：10余领域，从大模型到AIGC，谁更强？

相关阅读

最新评论

相关分类