论捧逗
不是在谈谁更好笑,而是在追问:为什么好笑能成立。文章以郭德纲、于谦的相声为例,从认知、节奏、边界与权力关系几个维度出发,讨论捧哏如何替观众站位、减轻理解负担、组织笑声,并把危险的冒犯控制在可笑而不失控的范围内。逗哏让人笑,捧哏让人敢笑,这也许才是相声最深的心理学。
相声说,三分逗七分捧。话说得熟,真正听懂的人却不一定多。
刚开始听郭德纲、于谦,很容易把注意力全放在郭德纲身上。包袱是他抖的,故事是他说的,夸张、胡扯、翻腾场面的人也是他。于谦站在旁边,好像只是接一句、挡一句、顺一句,仿佛这个位置换谁都能站。
但听得越多,越会发现真正让郭德纲的相声听起来舒服、顺滑、不累的,往往不是那些最响的包袱,而是于谦那些不抢眼的反应。一个“像话吗”,一个“您等会儿”,一个迟半拍的“嗯?”,就能把全场的气口、轻重和节奏拢到一块。郭德纲还是那个郭德纲,包袱也还是那些包袱,可一旦少了于谦,中间就像缺了一层东西:观众和包袱之间少了一道过渡,荒唐和安全之间少了一个缓冲,笑声也就没那么稳了。
也正因为如此,于谦的作用才会显得特别耐人寻味。他看起来不抢戏,却总像在暗中控制着什么;看起来只是“接话”,却又显然不只是接话。他到底在控制什么?是节奏,是分寸,是观众的反应,还是别的什么?也许,真正理解这一点,才算真正摸到了相声最深的地方。
#捧哏不是接话,而是替观众站位
我们抛开于谦,先来笼统的看看“捧哏”这个角色,在相声中的作用。捧哏最直接的作用就是作为逗哏的搭档,但又不只是搭档;他当然也在段子内部扮演某个角色,但这个角色往往都是曾经的自己,或者将来的自己,也就是说现在的自己不能完全被这个角色吞没。所以很多时候,他更像是观众在台上的一个化身,和观众一起来听逗哏讲故事。
捧哏最基础的作用,就是替观众保留一个常识位置。
这正是相声里一个很微妙、也很关键的结构。逗哏的职责,是把事情一点点说歪。他要夸张,要胡扯,要顺着一个荒唐逻辑越走越远,打破观众内容正常的秩序。
可问题在于,如果台上只有这么一股力量,观众很容易迷路。因为观众一边在听,一边需要判断:这句话是包袱,还是胡说?有些包袱铺垫很长,观众还要去回忆这段到底是还在铺垫,还是已经失控?如果观众在看演出的时候总是在想这些,就容易笑不出来。这个时候,捧哏的重要性就出来了。他可以统一观众的判断:你没听错,这里确实歪了;你不是一个人觉得奇怪,台上也有人觉得奇怪。
所以捧哏不是单纯回应逗哏,而是在不断校准立场。他像台上的观众代理人,让台下的人知道自己可以一边跟着荒唐走,一边保留正常判断。逗哏负责把观众拉进笑料,捧哏负责让观众知道从哪里进去。
美国学者 David Moser 在讨论相声时1,反复提到它和观众之间那种非常特殊的关系。相声不是一种追求沉浸感的表演,它会不断承认自己正在表演,也不断把观众拉进这个表演关系里。而在这种开放的结构中,捧哏恰恰是最容易承担“观众位置”的那个人。逗哏负责把表演往前推,捧哏负责替观众站稳脚跟。于是台下的人并不是直接跟上逗哏那套疯狂逻辑,而是先通过捧哏的反应,找到一个可以进入这场表演的入口。
#捧哏替观众分担理解成本
如果说相声最基本的本领之一,是把观众带进一条错误的理解路径里,再突然让这条路断掉,让观众意识到自己刚才理解错了并发笑。那么捧哏最重要的认知功能,让观众更轻松的走完这段路。
比如“大善人”这个包袱:
郭德纲:于老师的父亲,王老爷子,那是个大善人。心地特别善良,心太软,看不得穷人。
于谦:哦,老头有同情心。
郭德纲:有一次老头出门,大街上看见一个要饭的,哎哟,老头眼泪哗哗的,哭得不行了。
于谦:您看看,心软。
郭德纲:老头赶紧把四个保镖叫过来:“快!快把这要饭的给我打走!轰到街那头去!我心太软,真看不得这个!”
于谦:好嘛!原来是这么看不得啊?!这就叫大善人呐?
郭德纲先说于谦父亲心软,看不得穷人,观众自然会把“看不得”理解成同情;等他说老头让保镖把乞丐打走,因为“我心太软,真看不得这个”,原来的理解立刻塌掉。笑点就发生在这一瞬间:观众被迫放弃原先的解释,重新寻找能把前后矛盾解释通的新理解。
关联理论将相声的这个过程解释的很清楚2。观众理解相声,并不是被动接收信息,而是在不断寻找荒唐之间的“关联”。而且人会天然倾向于选择那个付出最小努力、却能获得最大语境效果的理解路径,这就是“最大关联”。相声恰恰利用了这种认知本能,逗哏的铺垫,把观众诱导上一条“花园路径”,让观众自以为已经明白了话的意思;然后在包袱抖响的一瞬间,突然推翻之前的理解,逼着观众放弃“最大关联”,去寻找那个真正能把前后矛盾重新解释通的“最佳关联”。而笑声,就产生在这个地方。
难点不在于被骗进去,而在于跳出来。
如果是脱口秀这样的单口喜剧,观众得独自完成这次跳转,所以脱口秀中需要考演员的停顿,来给观众反应的时间,观众需要自己察觉不对,自己暂停原先的理解,自己重新找路。这个过程当然也能完成,但会更耗力,也更容易让笑点在脑子里堵一下。
对口相声的高明之处就在于,这个最费劲的瞬间,往往不是让观众一个人扛,而是由捧哏先替观众做出反应。捧哏的价值,并不只是“问一句”或者“接一句”,而是替观众分担了一部分认知劳动。逗哏把话一步步说歪,捧哏则在最关键的节点上,把观众从原来那条错误理解路径上轻轻拽下来。观众一听见捧哏开口,立刻就知道:刚才那条理解有问题,这里该重新想了。在捧哏的帮助下,可以让观众在更小的思考成本下,做到“最佳关联”的转变。
这一点放到相声的历史环境里看,会更容易理解。相声早期本来就是一种露天市场、茶园、天桥环境中的地摊艺术,演员面对的不是安静坐定、愿意慢慢咀嚼文本的观众,而是一群随时可能分神、走开、起哄的人。这样的表演环境决定了相声必须快准狠,必须要有大量的包袱能一个接一个的响,并且还要让观众几乎不用费力就能跟上。某种意义上,捧哏正是在这种高压的现场条件下被磨出来的:他要替观众更快地发问,更快地迟疑,更快地把理解拽回正轨。相声之所以发展出如此成熟的捧逗结构,也许正因为它从一开始就不是书斋艺术,而是一种必须在最短时间里抓住人、带住人、留住人的现场艺术。
郭德纲:比如说跑步,从这里跑到那个墙那里,我跑了一个 14 秒。
于谦:那不错。
郭德纲:你跑了个七天。
于谦:对,嗯?【这里观众其实还没完全被逗乐】
郭德纲:裁判们就纳闷儿啊。
于谦:是啊,这孙子怎么轮椅坏了?【这里观众才被带到“最佳关联”里来,一起被逗乐】
这也解释了为什么好的捧哏总让人觉得“省力”。不是因为他把段子说简单了,而是因为他把观众原本要独自完成的那次认知跳跃,变成了一次有人领着走的转身。逗哏负责把观众引进花园路径,捧哏负责在岔路口替观众立一块牌子。真正高明的相声,不只是让人笑出来,而是让人几乎察觉不到自己刚刚经历了一次复杂的认知改道。
#捧哏不是跟节奏,而是在制造共同拍点
很多人谈相声节奏,第一反应往往是逗哏入活的速度、捧哏反应的快慢,或者哪里该停一停、顿一顿。但真听得多了就会发现,节奏远不是这么简单。相声里真正决定全场气口的,常常不是一句话说得快还是慢,而是那句反应来得比观众早还是晚,早了多少,晚了多少,刚好卡在什么地方。
相声的节奏,本质上是互动中的时间组织。
这一点,喜剧表演研究其实已经给了很重要的提醒。Attardo 和 Pickering 在讨论笑话表演的 timing 时,专门分析过单人喜剧 punch line (包袱)前后的停顿和语速变化3。他们发现,一个很流行的直觉其实并不可靠:笑点并不一定靠“先停一下”才成立,讲笑话的人在 punch line 附近也并不会稳定地显著加速或减速。也就是说,节奏并不能被简单理解为“哪里该顿一下”这种机械口诀。真正起作用的,是听众的期待如何被组织,反应窗口如何被打开,又如何被及时接住。
对比单人喜剧来看相声,会更加明显。单人喜剧里,观众虽然也会反馈,但台下两千个人不可能在同一瞬间理解、同一瞬间发笑。有人先懂,有人后懂,有人还没反应过来。这个时候,下一句什么时候进,就很难判断。
捧哏的作用,就是把这些分散的理解压成同一个拍点。逗哏把话送到悬空处,捧哏用一句“哎”“嚯”“去你的吧”“您先等等”,给这个悬空处打出落点。观众原本各自在脑子里完成的反应,被捧哏聚拢成一个公共时刻。
从这个意义上说,捧哏很像全场笑声的发令枪。
这也是为什么相声里那“零点几秒”会那么重要。Lawson 对郭德纲、于谦相声的分析,正好让这种感觉有了更具体的支撑。她在研究《笑傲江湖》时,把郭德纲、于谦和观众都纳入同一个分析框架,考察他们之间的节律和音高关系。在她截取的互动片段中,大约有一半的来回应答呈现出可辨认的节律组织。
这里的“节律性”并不是指固定拍点意义上的整齐划一,而是指演员之间、演员与观众之间的接续,在时间上形成了可感、可测的互动结构。这说明相声的节奏不是单人的语速控制,而是在现场互动中被共同生成出来的。;更重要的是,到高潮段落时,观众的反应数量和持续时间明显增加,甚至超过了于谦本人的回应长度。也就是说,观众不只是“在看”,而是在和台上的人一起进入节奏。Lawson 因而把观众理解为相声现场中的“第三表演者”。

从郭德纲说 140 岁上台捧着骨灰这一段,不难看出捧哏不是单独接逗哏的话,他还在接观众的笑,并把这两者重新缝成一条节奏线。
再看郭德纲反复拿于谦要唱高难度戏曲这一点做文章。郭德纲先不急着把高潮唱出来,而是不断拿于谦“怕高”“不敢唱”“唱不上去”这件事调侃、试探、刺激。观众当然知道高潮还没到,但他们的情绪已经被一点点吊起来。于谦在这里并不是单纯挨逗,他的每一次迟疑、每一次不情愿、每一次被逼着往前走,都是在替观众把情绪往前送。等郭德纲终于唱出那个高点时,爆发出来的掌声和笑声之所以那么整齐,不只是因为唱得好,而是因为前面的节奏已经把全场带到了同一条线上。这里的捧哏,实际上是在参与制造那个“全场同时准备好了”的时刻。
这能解释于谦那些“零点几秒”的价值。他不能太早,太早会抢走包袱;也不能太晚,太晚观众已经散开。最好的捧哏,是在观众快要反应但还没完全反应时,轻轻一推,让全场同时意识到:事情发生了。
郭德纲:(深情地铺垫)“我跟于老师,那感情太深了。相识十几年,风风雨雨,我们俩简直就是——异父、异母的,亲兄弟!”
于谦:(在“弟”字音刚落的瞬间爆喝)“废话!那不就是俩外人吗!”
这一段对话里,就可以看到于谦的高明之处,就是这个恰到好处的提前量,才能既不夺走逗哏的包袱,又足以替观众把笑声组织起来。从这个意义上说,捧哏并不是节奏的附属物,他本身就是节奏的一部分,甚至是节奏从台上流向台下的中继器。
也正因为如此,相声真正的节奏感,往往藏在那些最不起眼的小反应里。不是大段台词,不是炸裂包袱,而是那个“哎”、那个“得了吧”、那个“你先等等”。观众未必会在散场后准确记住这些词,但正是这些词,把理解、反应、笑声和全场气口拧在了一起。它们看起来只是捧哏的边角动作,实际上却是在为整场相声打拍子。
#捧哏管理的不是分寸,而是笑的安全感
相声还有一句话叫做,“理不歪,笑不来”。
很多包袱之所以成立,正因为它带着一点不安全:失礼、冒犯、胡说八道,或者拿常识开刀。如果一个段子从头到尾都稳稳当当、四平八稳,那就是郭德纲上春晚演的相声。相声要把人逗响,常常得先把事情推到一个“不太对劲”的位置上。
但纯粹的违背并不必然好笑。它也可能让人尴尬、皱眉,甚至反感。而相声之所以能有大量让人捧腹大笑的“伦理哏”、三俗包袱,就是所谓“良性违背理论”(BVT)在运作。4
按照这个理论,一个东西要想被感知为好笑,必须同时满足两件事:第一,它确实构成了一种违背,冲撞了人们对常识、秩序、体面或道德的期待;第二,这种违背又必须是良性的,也就是安全的、可承受的、不会真的造成伤害的。真正的笑点,就发生在这两者重叠的那个区域里。而 Kant 和 Norman 进一步强调,这个“甜蜜点”并不是固定的,它会随着社会距离、权力关系和具体场合而不断变化。
幽默 = 违背(Violation) + 良性(Benign) + 同时发生(Simultaneous)
这套理论放到相声里,逗哏做的,往往正是“违背”这部分工作。他负责把常识说歪,把逻辑拧断,把分寸推到边缘,把本来不该说的话说出来,以此来给相声带来原始的动力。而幽默发生在那条极细的钢丝上——它必须足够出格,又必须足够安全。这就是你说的“边界”。偏向左边就成了纯粹的冒犯,偏向右边就成了无聊的日常。
这在郭德纲、于谦身上尤其明显。郭德纲对于谦的很多“砸挂”其实还是重的。拿父亲开涮,拿老婆开涮,拿生活习惯、身份体面、家境教养反复做文章,放到普通聊天里,可能被说的人早就已经翻脸了。但问题恰恰在这里:为什么这些话放在于谦身上,观众通常不会立刻觉得这是霸凌,反而会觉得安全、顺畅,甚至越重越好笑?
答案不在段子本身,而在关系结构里。Kant 和 Norman 把幽默理解成一种受社会距离和权力关系影响的判断过程,认为幽默天然带有攻击性。这种攻击性是否能被观众接受,取决于一个极其重要的原则:喜剧可以“向上冒犯”,但极度排斥“向下嘲笑”。嘲笑一个比你更弱势、更悲惨的人,那叫霸凌,观众会感到生理不适;而嘲笑一个比你强势、地位更高、或者至少和你势均力敌的人,那叫讽刺或解构,观众会觉得痛快。
放到郭德纲、于谦这对搭档身上,之所以不会有那种冒犯的感觉,是因为他们承载着两套完全不同的社会资本和权力符号。
郭德纲作为逗哏,他的设定多为草根、底层、渴望暴富、狡黠的小市民,常常在社会规则中碰壁。他是一个“挑战者”和“破坏者”。而于谦的设定则倾向于家底殷实(王老爷子官宦世家、蒙古海军司令)、三大费钱爱好(抽烟喝酒烫头)、豁达从容。他代表着一种稳固的、精英的、拥有极高安全感的“既得利益者”或“旧秩序”。
所以,“砸挂于谦”之所以显得安全,不是因为内容不冒犯,而是因为于谦的设定太强大了,他拥有一种极强的“权力免疫力”。于谦在台上提供了一种非常关键的信号:我不会被这话真的伤到。观众潜意识里也就会知道:于谦有钱、有地位、活得比郭德纲通透得多。郭德纲那些气急败坏的冒犯、伦理哏的占便宜,本质上是“阿Q式的精神胜利法”,是一种底层的无能狂怒和自我解嘲。这种信号一旦成立,观众就会自动把郭德纲的攻击理解成表演中的越界,而不是现实中的伤害。相声最微妙的地方就在这里:他通过一个不会塌方的关系结构,实现了“违背”与“良性”的共同发生。
真正让“砸挂”成立的,不是郭德纲多会冒犯,而是于谦提供了一种足够强的承受面。没有这个承受面,越界就会变质;有了这个承受面,越界才会变成相声。
所以于谦管理的并不只是“分寸”。他管理的是观众的安全感。他让观众确认:边界被碰到了,但边界还在。
一方面是确认违背的发生。当郭德纲胡说八道时,于谦一句“像话吗!”或者“没听说过!”,是在替观众确认:“各位,这个违背我看到了,我知道他不正常。” 如果捧哏不指出来,观众会陷入迷茫,不知道台上这个人是不是真的疯了。
#于谦舞台身份的二元性
于谦还有一个特别关键的本事:他总像同时站在两个地方。
一方面,他当然在段子里。他要扮演角色,要接剧情,要顺着郭德纲那套越来越离谱的逻辑往前走。
可另一方面,他又总像半个局外人。他会突然露出一种“我也知道这事不对”的神情,会用一句特别轻的吐槽把自己从段子里抽出来一点,像是和观众一起站到边上,看着郭德纲继续胡闹。
郭德纲:比如说跑步,从这里跑到那个墙那里,我跑了一个 14 秒。
于谦:那不错。
郭德纲:你跑了个七天。
于谦:对,嗯?【这里观众其实还没完全被逗乐】
郭德纲:裁判们就纳闷儿啊。
于谦:是啊,这孙子怎么轮椅坏了?【这里观众才被带到“最佳关联”里来,一起被逗乐】
这就是相声特别重要的一种结构能力:它允许演员一边在戏里,一边又不完全被戏吞掉。
Moser 讨论相声时,特别强调它的自反性。相声不像很多封闭叙事那样,要求演员和观众一起忘掉“这是一场表演”。相反,相声经常会直接承认自己正在表演,甚至把“正在表演这件事”本身也变成笑料。也正因为如此,相声的框架不是封死的,而是流动的。演员可以进,也可以出;可以演角色,也可以忽然像演员本人一样说一句;可以在故事里,也可以突然站到故事边上评论故事。
于谦最厉害的地方,就在于他特别会做这种切换。
他有时候是段子里那个被调侃的人,有时候是台上的职业捧哏,有时候又像一个普通观众,替大家把心里的话先说出来。正因为他能在“角色中人”“相声演员”“场外旁观者”这几个位置之间来回切换,所以他才会显得特别像观众的化身。观众不是直接扑进郭德纲那套疯话里去理解,而是先通过于谦找到一个站位:原来我可以既在场,又保留判断;既跟着走,又不至于迷路。
这也是为什么于谦的捧哏会让人觉得特别“真”。不是因为他说的内容更像真话,而是因为他的站位本身就很真。他既不完全沉进荒唐里,也不彻底跳出荒唐外。他始终留着一只脚站在观众这边。于是,观众在看相声时,其实并不是只有耳朵跟着郭德纲走,眼睛和心理位置往往都在跟着于谦走。
所以,于谦不是简单地替观众反应,而是在台上替观众占了一个位置。那个位置非常重要。没有它,观众只能被动接受逗哏制造的一切;有了它,观众就能一边跟着疯,一边始终知道自己站在哪里。
#捧哏,市场的自然选择
把这些合在一起,于谦的作用就不再神秘。
他替观众站位,让人知道荒唐从哪里开始;他替观众转向,让人用更小成本完成理解;他替观众卡拍点,让分散的反应汇成同一阵笑;他替观众确认安全,让危险的冒犯变成良性的越界。
逗哏让人笑,捧哏让人敢笑。这不是一句漂亮话,而是相声结构里最核心的分工。
观众不是听懂了就一定会笑。人在笑之前,还要确认自己没有误会,确认周围人和自己在同一个节奏里,确认这次越界不会真的伤人,确认自己笑出来是被允许的。相声高明的地方,就是它没有把这些工作全扔给观众,而是在台上安排了一个人,提前替观众完成。
这个人就是捧哏。
于谦的伟大,不在于他说了多少惊天动地的话,而在于他总能在最关键的地方把观众托住。他不一定制造最大的爆点,却决定了爆点能不能稳稳落地。没有他,郭德纲的很多包袱依然存在,但它们会更硬、更散、更危险,也更像单纯的表演。
真正好的捧哏,不是站在逗哏旁边的人,而是站在观众心里那个迟疑的位置上。逗哏负责把话说疯,捧哏负责让这份疯狂可笑、可懂、可承受。
这就是捧哏真正的分量。
注释
- 1Moser, David. 《Reflexivity in the Humor of Xiangsheng》. CHINOPERL 15, 期 1 (1990): 45~68. https://doi.org/10.1179/chi.1990.15.1.45.↩
- 2曾蓉和熊永红. 《相声言语幽默理解的心理机制——基于关联理论的视角》. 湖南农业大学学报(社会科学版) 12, 期 1 (2011): 78~82. https://doi.org/10.3969/j.issn.1009-2013.2011.01.014.↩
- 3Kant, Leo, Elisabeth Norman. 《You Must Be Joking! Benign Violations, Power Asymmetry, and Humor in a Broader Social Context》. Frontiers in Psychology 10 (2019年6月): 1380. https://doi.org/10.3389/fpsyg.2019.01380.↩
- 4McGraw, A. P., & Warren, C. (2010). Benign Violations: Making Immoral Behavior Funny. Psychological Science, 21(8), 1141–1149.↩