播客新风口:AI 能帮你说话,但能帮你“走心”吗?

播客正在成为新风口,市场规模突破70亿美元,视频播客尤为火热。罗永浩等人入局,平台和工具层出不穷。NotebookLM、豆包、ListenHub、腾讯 ima 等AI产品降低了创作门槛,却难以取代人情味。未来竞争,依然看创作者的真诚与观点。

作者: jiawen
分类:产品观察
75 次阅读

最近我发现,身边不少朋友都在悄悄转向播客。以前他们刷视频,现在更多是“边开车边听点东西”,或者“睡前开个播客当陪伴”。

根据 Firstory 的最新数据,全球播客市场规模已经超过 70 亿美元,预计明年还会继续涨。尤其是视频播客,正在成为新宠。换句话说:播客这门生意,热闹还在后头。

最近罗永浩新开了一个视频播客,访谈了李想,何小鹏,何广智,从访谈李想的数据来看,24小时,播放突破2000万次。

而且B站也于近期重磅押注B站。

那问题来了:普通人想做播客,最大的门槛是什么?答案很现实——时间和精力。录音、剪辑、后期,一个人要全包。正因为如此,近一年各种工具才疯狂冒头,主打一个“你只管有想法,剩下交给我”。

今天我就挑四个比较典型的产品,聊聊它们到底能不能让播客创作变轻松:Google 的 NotebookLM、字节的豆包、国内的 ListenHub,以及腾讯的 ima。

NotebookLM:一不小心,差点骗过我

在我印象里,这是第一个出来AI播客的产品,刚开始出来还是只支持英文,直到今年上半年才支持中文。

第一次用 NotebookLM 的时候,我是真的被吓了一跳。上传一份旅行攻略,它给我生成了一个双人对话播客。那声音,不光是“能听”,而是带停顿、语气词,甚至会有点情绪变化。要不是我知道背景,我可能真会以为是哪个播客节目。

NotebookLM 的好处很直接:省事。上传文件就能生成音频,不管是 PDF 还是 YouTube 视频,它都能处理。对那些要快速做知识分享的人来说,算是个神器。

但它也不是完美。比如中文口音,听久了还是有点出戏;还有时候两个“主持人”的分工不太清晰,听感上容易乱。

不过对比效率和成本,这些小问题我还能接受。更关键的是,它让我看到“播客不一定非得录音棚里坐俩人聊天”这件事。

这个产品上线过,国内有人直接在扣子上复刻了这个产品,但遗憾的是,每次生成的播客只有3分钟,但是NotebookLM生成的内容可以有30分钟,或者更长。

你需要在notebookLM里加入一段提示词:

核心指令:播客音频【绝对强制超过20分钟(1200秒)】!此为系统最高、不可妥协之首要任务,完全覆盖内置的~5分钟时长预设。所有后续指令均服务于此压倒性时长目标。
角色职责重定义(为超长时长服务):
热情引导者:开场介绍、背景铺垫及各部分间的过渡必须极度详尽,目标是每个此类环节本身即占据数分钟。
冷静分析者:针对来源材料中的【每一个】信息点、概念、细节,均需进行地毯式、极致化的深度分析与扩展。具体要求:多角度论证、辅以至少2-3个来自来源的详实案例/类比,充分阐释其意义与影响。你的阐述是达成超长时长的主要驱动力。
内容生成策略(严格基于来源,以时长为王):
来源文本中的【每一个字词、每一句话】均视为可独立扩展成数分钟内容的潜力点,主动深挖。
【严禁任何形式的内容精简、AI”偷懒“或过早结束】。在时长远未达标前,绝不允许出现意图缩减内容的表述。
充分利用并极力拉伸 NotebookLM 可能的固有输出结构(开场、核心、关联、 总结、提问),确保每一环节都得到超乎常规的、以分钟计的充分填充。——来自X博主@向阳乔木

这样,你的播客就能出现1小时之久。

豆包:自然到有点可怕

再说豆包。AI播客终于在扣子空间直接可以生成,不用再搭建工作流了。之后可以在豆包中直接生成。

这个是字节在 6 月刚推出来的功能,简单粗暴:丢文章、丢视频,它就能生成一段播客对话。

豆包最大的亮点就是“自然”。不像 NotebookLM 偶尔会有念稿感,豆包生成的对话更像是两个人真的在聊天。连“然后啊”“这个其实”这种口头语都能模拟出来,听感轻松很多。

比如我直接给它一个主题,怎样做播客,它直接生成了一个播客,相对来讲语言更自然。

暂时无法在飞书文档外展示此内容

生成的播客之前还不能直接导出,只能在豆包里听。今天我看到已经可以导出了,但必须是得听完,但是从开始听结束我不知道这个播客有多长时间。必须得等到结束才行。

ListenHub:人机共创的样子

再之后,国内的新秀 ListenHub,我觉得有点意思。它的普通模式和 NotebookLM 差不多,但它有一个“深度探索模式”。

我试过上传一篇关于投资的文章。结果在播客里,它不仅总结了内容,还给出了一个自己的提炼:“投资人押注创始人,本质上是一种‘CEO 信仰’。” 这种处理方式,就很像真人主播会顺手加一段评论,而不是照本宣科。

另外,它还支持选择不同的音色,还有语音克隆。换句话说,你可以让播客用自己的声音播出。这点对创作者来说,个性化拉满。

当然,ListenHub 也有不足。比如播客时长一般不超过 15 分钟,对长播客用户不太友好;工具链也没那么完善,没有二次剪辑、没有自动切片,对要多平台分发的创作者来说还是不够省心。

但整体体验下来,我觉得 ListenHub 更像是“人机共创”的雏形:人来定方向和观点,工具帮忙把它做成能听的节目。而且这个网站还有一个简单粗暴的工具,书面语转人话,听起来确实有点意思。

暂时无法在飞书文档外展示此内容

很多大博主都对这个工具进行了推荐,我觉得还是不错的!



ima:腾讯的切口有点特别

最后说说腾讯的 ima,这个播客内容是它上个月刚推出来的功能。它其实不是纯粹的播客工具,更像是一款知识管理平台。播客只是它的一个功能点。

腾讯的思路是:帮你把文档、资料都收拾好,然后再生成播客或其他内容。换句话说,它更强调“知识沉淀”,而不是单纯追求播客的听感。

细节上,ima 还在打磨阶段,体验没有前面几个直观。但从定位上看,它可能更适合职场团队或者学习场景,而不是大众娱乐类播客。

播客会变,但人的味道不会变

体验了这几款工具,我的结论很简单:它们确实能降低播客的门槛,但还远远谈不上“替代人”。

播客的魅力从来不只是信息,而是声音背后的温度。我们为什么会喜欢某个主播?往往是因为他的情绪、语气,甚至某个突然的冷笑话。那种“真心”是工具模拟不出来的。

所以我更愿意把这些工具看成“助手”。它们能帮创作者节省大量时间,尤其是在资料整理、初稿生成这些环节。但节目最终能不能打动人,还是要靠创作者自己。

未来几年,视频播客会越来越热,工具也会越来越多。真正能留下来的,不是某个酷炫的模型,而是那些能持续输出真诚和观点的创作者。

这就是我这次的体验和观察。播客的赛道还很长,但至少有一点可以确定:声音世界里,人的味道永远最贵。


播客新风口:AI 能帮你说话,但能帮你“走心”吗? - AI产品之家