聚云动媒 首页 技术 AIGC应用 查看内容

字节和快手混战AI:10余领域,从大模型到AIGC,谁更强?

2024-6-27 21:35| 发布者: 一灯| 查看: 195| 评论: 0

摘要: ​抖音和快手都以短视频业务作为核心,更是在多个领域上,双方都有着相似的步伐,比如抖音做电商、快手也做电商;抖音做外卖、快手也做外卖。如今,当AI在国内大火之际,两家平台也都将目光瞄准在了大模型及AI产品上 ...

​抖音和快手堪称国内最“密接”的欢喜冤家,在很多领域都是同场Battle。


两者不仅仅都以短视频业务作为核心,更是在多个领域上,双方都有着相似的步伐,比如抖音做电商、快手也做电商;抖音做外卖、快手也做外卖。如今,当AI在国内大火之际,两家平台也都将目光瞄准在了大模型及AI产品上。


对于AI这一块的投入,字节和快手的力度并不小。


字节于2023年成立专供AI 的Flow部门,并抽调了内部的高层管理和业务骨干担任该部门的相应负责人,其中前Tik Tok产品技术负责人朱文佳任部门的业务负责人、字节跳动产品和战略副总裁朱骏任部门产品负责人,字节跳动技术副总裁洪定坤担任该部门的技术负责人,三方协同合作推进AI进程。


期间仍不断有其他业务线的高管加入,譬如抖音社交负责人陆游、以及飞书产品副总裁齐俊元,先后加入Flow。


近日,外界在传字节旗下的大力教育业务zero本月底可能合并进豆包,合并后如果人员有冗余,可能伴随着优化。


笔者了解到,包括大力教育旗下的河马爱学在内的AI产品在今年年初就已经划归Flow。此外,不久前字节跳动推出的AI虚拟交友聊天平台"小黄蕉"(英文名Chatwiz),实际上也是挂在大力教育下,其产品初期只是一个语言学习数字人产品。


而为了加强AI战略,字节的其他部门也没闲着,包括剪映、巨量引擎、抖音主端、抖音电商、飞书等部门,都在加码各自的AI业务,成果陆续落地。


快手同样是在2023年年初,启动了新AI战略,结合并赋能现有业务场景,全面布局AI各种产品布局。在2023年Q3财报会议上,快手CEO程一笑介绍,快手的语言大模型-快意130亿和660亿大模型已达到行业内同等规模领先水平,同时也已经开始超千亿规模语言大模型以及多模态大模型的研发。


笔者了解到,快手AI主要由快手AI技术团队(注:此前的快手Y-tech部门)负责。快手AI技术团队拥有人工智能领域专利超过1千件,在北京、深圳、成都、杭州、Palo Alto多地均有研发团队。


快手AI开放平台是快手推出的AI服务平台,面向市场提供AI技术服务,产品服务涵盖计算机视觉、计算机图形学、自然语言处理、音频技术、视频技术、知识图谱、机器学习、AR/VR/MR、多模态等核心技术领域。


在产品落地方面,除了对标字节豆包的快意大模型外,还推出了可灵、可图等等各类AI产品,对标字节的Dreamini等产品。


从实际出发,快手和字节的AI产品的真实体验到底如何呢?笔者选取了几个热门赛道,进行了对比评测,以期帮大家明了各家在哪些领域布局,以及进展更快些。


10余款AI产品,字节和快手针尖对麦芒笔者根据公开资料以及掌握的信息,整理的有关字节和快手在国内AI各领域所推出的产品及功能图表。



注:根据公开资料以及鲸哥内讯整理并制图字节和快手的部分AI产品会有着相同的AI功能,这里选取双方在某个领域上更具代表性的AI产品进行对比测评。


大模型领域,字节更强,快手更稳

大模型是一切AI产品落地的技术基础,也是未来两家AI发展的助推火箭。

从团队看,双方都给予了AI业务高规格的待遇,不仅仅都有副总裁级别的高管参与,而且团队成员也都是从各业务线中抽调的尖兵。


产品方面,字节有着豆包大模型,快手则是快意大模型。双方的主要应用场景都位于对话场景。字节在2024年5月将国内外三只团队合并后,整合成豆包系列大模型,刚一面市就发起了价格战,颇有一种舍我其谁的气势,其对应的AI对话产品豆包App,也快速蹿升到行业月活前几名。


快意大模型则是应用于快手低调推出的大模型,相比很多已经过万亿的大模型,快意大模型还没有千亿大模型,但胜在踏实,每个模型的参数不算大,但是测评效果和多模态能力都不错。


笔者从最主要的是产品功能、对话逻辑等方面对这两个产品进行了测评。


产品功能方面,豆包的功能较多。除了基础的文字输入对话聊天外,还增加了通话功能,用户可以与豆包虚拟人进行一对一的聊天,另外,豆包还支持文生图、拍题答疑等服务,而快手的AI对话则只能进行基础的文字聊天,产品化进度比较落后。


对话逻辑方面,当笔者输入“快意大模型”的关键词后,豆包会给予较为详细的回答,而快手APP内的AI对话则表示不清楚。


注:左豆包APP,右快意AI对话功能


另外,还分别向两个产品询问“北京旅游攻略”的问题后,豆包会给予详细的规划行程,包括每一天的行程安排等,并给予注意事项,而快手AI对话仅提到一个不知名的景点,此后并无更多赘述。笔者还输入了其他日常用的较多的问题,分别对两个平台进行询问,从回答效果看,豆包大模型的回答要好于快手的快意大模型。


整体体验上,豆包大模型在对话方面的综合体验上较好。


AI绘画工具:字节明牌弱暗牌强,快手可图表现领先

字节和快手在AI绘画工具上都有着尝试,从产品数量看,字节的AI绘画工具较多,比如今日头条的AI绘画功能,抖音的即梦,以及抖音星绘,快手则是可图。


从产品相似度看,星绘和可图更为接近,所以这里主要比较字节的星绘和快手的可图的工作能力。

可图和星绘的功能很像,不仅都拥有AI分身创作服务,也都拥有文生图功能。


AI分身方面,可图和星绘各有千秋。可图支持动漫分身创作和单人写真,分别有8大动漫主题和4个写真主题供用户选择,用户在上传人物照片和选择主题后,即可生成对应的AI照片。而星绘则更倾向于开放式创作,除了类似可图那样已经备好的主题和模板外,用户也可以在上传人物图片后,输入提示词,去生成AI分身,但时间在1分钟以上。


文生图功能则是这两大产品的又一项重大服务。但从效果看,可图更胜一筹。当输入“西瓜”的关键词后,并选择默认主题后,可图生成了四幅不同,且视角不一的AI图片,而星绘则是生成多幅类似,且视角唯一的AI图片。随后,也试着输入火锅、小鸟,以及复杂的提示词,从最终的效果看,可图也都较为符合。


注:左为快手可图生成效果,右为抖音星绘生成效果。


整体上,可图较符合大家的创作需求。但未来预计即梦将成为字节的主要AI视觉生成产品,毕竟这款产品是原抖音CEO张楠带队。


AI社交:字节重视,快手浅试

AI始终都是互联网的必争之地,随着AI的出现,AI社交成为了重要的赛道,腾讯、百度、阿里、美团、字节、快手纷纷推出了自己的AI社交产品。


其中,字节的AI产品为猫箱,以及内测中的小黄蕉,快手也有一款,笔者独家了解到,快手的AI社交产品名为“快崽”。


这些都是AI角色聊天产品,用户可以与个性鲜明、背景各异的 AI 角色实时聊天互动,或是闲谈生活日常,或是进行深入交流,或是演绎剧情故事。


这里以猫箱和快崽作为对比,来看下字节和快手在AI领域布局的殊途。


从产品功能看,两者都支持创建不同背景的虚拟角色。但字节猫箱所创建的虚拟角色更有质感,不仅可以选择绘图风格,还可以对角色进行配图,以及增加语音功能。


此外,在生成虚拟角色后,还会自带虚拟角色形象的聊天背景图,使整个聊天更具沉浸感。快手的快崽在创建虚拟角色的过程中,则没有这些细致的步骤,仅需输入名字、性别和角色设定即可创建一个虚拟角色。


社交对话质量上,猫箱的虚拟角色在对话上,更具趣味性。比如,在这两个产品上创建同为淑女设定的虚拟角色,并分别进行相同话题的询问,猫箱会主动规划接下来的故事场景,并寻求建议,容易让用户掌握聊天的主动权,进而发展故事脉络的走向,而快崽则偏向于询问式的聊天,让用户处于一个被动聊天。


注:左为猫箱,右为快崽。



另外,猫箱还多了一个创建故事的功能,用户可以创建多个虚拟角色与自己进行互动,提供了更加真实和自然的交流感受。


AI剪辑:字节剪映更成熟,快手快影更丰富

AIGC最重要的应用场景之一是短视频,字节和快手两家同样在AI短视频创作领域进行了加码。


目前,字节的剪映和快手的快影,纷纷推出了各自的AI功能。


剪映的AI功能主要包括智能剪辑、语音识别和自动字幕生成等。它可以自动识别视频中的精彩瞬间,并将其剪辑成一个完整的视频。同时,剪映的语音识别功能可以将视频中的语音转换为文字,并自动生成字幕。此外,剪映还提供了一些一键成片和AI数字人的能力,算是比较成熟的AI剪辑产品。


快影的AI功能则主要集中在视频剪辑和特效制作上。它可以自动识别视频中的人物和物体,并进行跟踪和剪辑。同时,快影还提供了一些AI特效和滤镜,可以让视频更加炫酷。此外,快影还支持AI一键成片功能,可以根据用户选择的照片和音乐,自动生成一段视频。


从功能丰富度看,快影虽然AI功能居多,不仅有文生视频、文生图等主要功能,还有AI动漫、AI照相馆等十余个功能玩法,剪映的AI功能则较少,包含AI商品图、AI特性、AI作图等。


当然,AI在剪辑工具的最重要的一个指标还是成片的质量如何。笔者将同一视频放进这两个产品中,并使用AI成片的功能。从成片效果看,两者的体验没有太大差距。


注:作为快影,右为剪映。


总的来说,剪映和快影的AI功能都非常强大,可以帮助用户更加轻松地完成视频剪辑和制作。但它们的侧重点略有不同,用户可以根据自己的需求和使用习惯选择适合自己的软件。


视频生成大模型:字节努力,快手惊喜

自海外的Sora爆火后,文生视频成为了国内AI玩家的重头戏,字节推出了PixelDance, MagicVideo, AnimateDiff-Lightning等算法模型,并落地视频生成产品即梦,快手则是在近期上线视频生成大模型产品可灵。


字节和快手对视频生成大模型都非常看重。例如,视频生成产品“即梦”,是抖音前CEO张楠亲自挂帅的剪映所推出的产品,即梦的视频生成技术来自PixelDance。可灵为快手AI团队自研,基于快手在视频技术方面的多年积累,采用类似Sora的DiT技术路线,结合多项自研技术创新,效果对标Sora。


即梦和可灵都支持文生视频和图生视频两种模式。


以文生视频为例,输入相同的文本后,需要等到1-2分钟左右,方可生成视频,不过两者的视频时长不一,即梦和可灵分别生成了3秒和5秒的视频。最终呈现的内容质量,如分辨率、帧率和内容效果都大差不差。


值得注意的是,即梦囿于视频大模型应该不是Di-T架构,在语义理解和视频生成上都略差意思。而可灵在更多生成场景中表现优异,并且在生成时长方面更具优势,近期已开放视频续写功能,最长可以生成3分钟左右的视频。这在国际中都算不错的成绩。


发力更多AI领域,抖快从地上打到了天上

笔者独家了解到,字节在AI领域的进展正在加快,且应用领域也在拓宽。


比如,抖音正在测试一个名为AI分身空间的功能。这是抖音创作者与抖音合作生成的AI分身,基于创作者提供的人物设计、知识库、声音、形象等素材而生成。


注:AI分身空间功能。



AI分身可在创作者设置的场景中与用户互动:如抖音创作者已开启AI互动空间,用户可以通过点击他的个人头像等方式进入AI互动空间,与创作者AI分身互动;如抖音创作者主动在用户与创作者的群聊内添加他的AI分身,用户作为群成员可与他的AI分身对话和互动。


该功能基于生成式人工智能技术提供对话及互动服务,AI分身输出的内容均由AI生成,非创作者本人回复。


此外,据了解抖音的AI创作平台即梦也将推出音乐生成功能,打造国内版的Suno,目前正在招募测试者进行测试。


快手也同样加码了在AI音乐方面的能力。笔者独家获悉,快手旗下的K歌APP回森,推出AI美音功能,可以让用户唱的歌曲,通过智能修音,获得更好的K歌体验。该功能已经成为回森的一个重要功能专区。


注:回森的AI美音功能


随着时间的推移和AI在各领域的开花,字节和快手在AI上的交锋还将继续,谁又能拔得头筹呢?





相关阅读

最新评论