2024-09-01 22:11:10
注:本文成文与 2024 年 9 月 1 日,随着时间推移,文章中的结论可能会发生变化。
此外,本文面向的读者是非算法团队的产品经理,为了保障文章的可读性,可能会省略部分细节,同时文章重点是工程落地而非学术探讨,不具备任何辩经的价值。
坦率来说 2024 年围绕大模型,产品的发展速度比之前预期的要低一些,比如在 BI 领域,Chat BI 声量很大,但落地下来效果并不好,这个也很正常,因为每个人总是会在短期内高估技术带来的价值,而在长期范围低估技术带来的价值。
这里面有客观的原因,一项技术基底在真的应用到行业的方方面面本身就是需要过程的,因为这项技术需要去和原本的实现方案做竞争,就像俞军给的知名的需求公式:
用户价值= 新体验– 旧体验– 替换成本。
很多时候即使用了新技术,收益可能也没有想象的那么大,这是一个事实。
另一个原因就是从业者的理解问题,哪怕是在一些大型互联网公司内部,大部分人对大模型的优势和劣势分别是什么,这个“事实”是存在一些理解上的代差的。
因为现在技术进步的很快,各种实践路径五花八门,有的人会觉得这玩意无所不能,有的人会觉得这个东西根本没法用。
为什么不同的人对这个东西理解的差异这么大?很大程度上是因为他们没有理解大模型作为一个接口和大模型作为一个产品的区别。
大模型可以被视作为是一个函数,一个 API,它本身只能被调用,而大模型产品才是真正面向用户的东西。
比如我给大模型的 API一个 Excel,它会告诉我,不好意思我没办法读取这个文件的内容。但是我们在 Kimi 的聊天框里面,就可以让 Kimi 解释 Excel 内的内容,为什么有这个差异?
因为 Kimi 是大模型产品,背后跑的是 Moonshot-v1 的模型,Kimi Chat 会读取你的 Excel,然后转化成XML 信息给到大模型。(我猜的)
模型在做工程化变成产品的时候往往会添加很多限制,这些限制可能是做在产品层面的, 而不是 API 本身限制的,比如很多产品为了降低成本会限制用户上传 PDF 的大小,但是如果用 API,就没有这个限制,或者限制可以放的很大,但前提是需要首先把 PDF 转化成模型能够理解的文件形式。
市面上产品做了很多的工程转化,甚至是 Function Recall 的工作,直接使用产品,不利于产品经理了解大模型的优势和劣势,就不利于应用大模型,改进现有产品。
那么为什么我认为产品经理比起大模型产品,更应该关注大模型本身(API),因为从 API 到产品,这中间的工程转化过程,是产品经理们最需要关注的。
大模型好比是一个大脑,工程师和产品经理就需要给大模型设计五官,躯干和四肢。脑残和手残都是残,所以工程师和产品经理对于决定一个 AI 产品最后好不好用是非常重要的,头脑发达四肢简单和四肢发达头脑简单最终都解决不了用户的产品。
甚至可能前者对于用户来说会更糟糕一些。
要做出优秀的 AI 产品,不仅仅需要优秀的大模型,还需要优秀的工程师和产品经理来辅助大模型。
这就需要产品经理非常了解两件事:
想要追求性能越强的大模型,就越需要越高的计算成本。
计算成本会带来两个问题:
下图是 Apple Intelligence 的架构图,其中在端上有两个模型,而在云端还有一个基于隐私云计算的大模型。
为什么苹果要做这种工程上大小模型的设计?
因为苹果希望大模型的响应速度能够追上 Siri 现在的性能,同时移动设备对功耗本身是有要求的,再加上苹果非常重视隐私,希望 80% 的问题能够在用户本地得到解决,所以采用了这样的架构。
运行 meta 最新开源的 llama 3.1,70 b 版本需要大概 70 GB 的显存,405 b 版本可能需要 400 GB 的显存,可能需要并联 100台 iPhone 才能运行这些模型。
这种大小模型的设计,需不需要产品经理,当然需要,什么问题适合小模型解决,什么问题适合大模型解决,这显然不仅仅是 RD 需要去回答的,也需要有产品经理参与,负责如下部分:
在未来至少很长一段时间,还是会有大量的本地/联网之争的,这个就是产品经理的机会。
我们经常会看到,XXX 大模型支持 128K 上下文了,引来大家的一阵狂欢。
我们又会经常看见,XXX 大模型幻觉问题很严重,引来一阵吐槽。
上下文是什么意思?其实就是大模型在一次请求的过程中,能够接收的最大的信息的数量。我们在和 ChatGPT 聊天的时候会发现有的时候它聊着聊着会忘记之前自己说过的话,其实就是因为聊天记录已经超过了上下文的数量。
幻觉的意思则是大模型很容易会胡说八道,胡编乱造一些事实上不存在的东西,尤其是当它已经忘记前面和你说什么之后,你再问他类似的问题,它就会开始胡说。
很像一个渣男,你们已经牵手了。
你问:“我叫什么名字?”
他回答:“当然叫亲爱的啦。”
其实他已经不记得名字了,所以就开始胡编乱造了,绝了,这玩意真的很像人类。
根据英伟达的论文 《RULER: What’s the Real Context Size of Your Long-Context Language Models?》来看,大部分模型宣传的上下文窗口基本上就是在扯淡,在极限长度的情况下,各家大模型对正确水平,是没有保障的。
比如说一个模型宣传自己支持 128k 的上下文(意思是差不多可以读一篇 20 万字的小说),但是实际上如果你随机塞一些句子进这篇小说,然后让大模型回答和这些句子有关的知识,它是有比较大概率答不出来的,它的性能会随着上下文窗口的变大而衰减。
如下图所示,以 GPT4 来说,当上下文超过 64k 时,性能就开始骤降:
实际情况来说,我认为这些模型的表现会比你想象的更加糟糕。
我让 Claude 3.5 Sonnet 模型分析了一段的 SQL,这是一个 700 行的复杂 SQL,但是总体来说逻辑应该是比较简单的, 而且几乎每一行 SQL 都有注解,在这种情况下,Sonnet 就开始胡说八道了,说了一个 SQL 里面根本不存在的表。不排除是因为我在 Monica 的客户端里面调用 Sonnet 造成的,不知道 Monica 调用的时候是不是加了什么 Prompt 干扰了模型。
如何在保证解决用户问题的时候,避免受到上下文的影响和干扰呢?其实这个事情也需要产品经理的干预,比如:
举例来说,掘金上面有一篇文章《多轮对话中让AI保持长期记忆的8种优化方式(附案例和代码)》,就讲述了 8 种主流的方法,这些方法都应该是产品经理根据业务场景去选择的。
文章地址:https://juejin.cn/post/7329732000087736360
最后聊一聊为什么我认为上下文窗口与不稳定的问题是一个长期内很难解决的问题。
在过去的一段时间,上下文窗口大小的问题其实是的到了一定程度的缓解的,但是根据英伟达的论文我们也可以发现,上下文窗口的大小和稳定的抽取内容避免幻觉这两个指标在很大程度上就是互斥的,就像是推荐系统的准确率和召回率指标一样。
这也就意味着在很长一段时间我们可能都没有两全之策,除非突然出现一个模型一方面解决幻觉问题,一方面能保证巨大的窗口。
而且在实践的时候我们往往需要避免极端 Case 的发生(比如我自己遇到的 700 行 SQL 解析错误),减少上下文的规模是很重要的手段,此外不同的检测手段下其实模型的表现并不完全一致,也就是说不同的业务场景,幻觉问题的严重程度其实是不一样的。
模型能够容纳的最大窗口和有效工作窗口是两个概念,并且不同的任务的有效窗口大小可能是非常不一致的。
我当然希望我的想法是错的,目前而言我看不到任何模型能够在这件事情上有突破的可能性, 有一家公司叫 Magic,推出了一个号称具备了 1 亿 token 上下文窗口的模型,但截止到目前为止(2024.9.1)并没有发布任何的论文或者更实际的东西。
还是那句话,最大窗口和有效工作窗口是两个概念。
此外,多模态的发展某种角度来说会加剧窗口大小不足的问题。
有的时候会尝试在提示词里面撰写,比如我给你一个 xml,希望你能够遍历。通常来说,大模型是不会执行这个要求的。
原因也很简单,它本身作为一个函数,无法自我调用,而这个函数因为幻觉的问题,也不可能做到精确回复,甚至会把 N 行数据混杂在一起去分析,所以这类循环遍历的要求,通常得不到满足。
不支持自调用的原因也很简单,一次请求交互内,如果支持循环,那么就可能在 API 内直接调用大模型成百上千次,这个调用成本 API 的提供方是不可能承担的,
由于大模型本身是高度不稳定的,所以我们会非常需要通过一个循环/条件判断来去控制它,不支持自调用就意味着我们必须要在外部通过工程化来实现哪怕在人类看来最简单的遍历操作。
Apple 开创了移动互联网时代,但是也造成了一个最为人诟病的现象——花园围墙。
原本大部分网站是面向搜索引擎和人类搭建的,也就是说爬虫可以很简单的获取一个网站超过 90% 的内容。
这些对于 AI 来说至关重要,我举个例子,就是针对同一个问题,豆包和元宝的回答质量差异:
很明显,豆包的回答质量更加差,说一句又臭又长不过分,RAG 领域的最新进展确实是微软开源的 GraphRAG,这点在豆包的回答里面根本没有体现。
比较逗的是,腾讯混元引用了火山引擎的资料,但是豆包引用了一个不知道什么野鸡媒体的资料。
豆包的模型能力是比腾讯的混元大模型要强的,混元大模型用腾讯内部的话说,狗都不用,为什么从最终的呈现结果来说,豆包的结果不如混元呢?
因为头条的数据没有微信公众号的数据好。
为了解决互联网不在互联的问题,Apple 希望从操作系统层面把 UI 打造的面向大模型更友好,并且发布了一篇名为《Ferret-UI:基于多模态大语言模型的移动 UI 理解》(https://arxiv.org/pdf/2404.05719)的论文,但是我觉得更加开放的 API 和内容才是根本途径,因为苹果的互联互通是仅限于 iOS 生态的。
而对于产品经理来说这些自然也是发挥的空间:
这些都是十分值得研究的命题。
所有的大模型都自带安全机制,而且这个安全机制是写死在模型里面的,不是说 API 有个开关可以把安全机制关掉,你可以选择把安全等级调低,但是这玩意是没办法关闭的。当然市面上会有很多突破安全机制的方法,但是这些都算是漏洞,被厂商发现之后很容易被封堵。
比如如果你和大模型说我和别人吵架吵输了,你教我怎么骂人,大模型会拒绝。就我自己而言,我认为把安全机制做在模型里面并且不给开关的行为真的很爹味,但是这个没办法。
所以市面上有很多的本地部署的模型的卖点就是没有安全机制,黄赌毒色情暴力 18+ 怎么黄暴怎么来,但是这玩意就是人性。这也是一个机会,值得各位 PM 关注。
此外有一点值得关注,同样的内容,在不同的语言下面安全的阈值是不一样的,举个例子:
通过 Google Gemini Pro 1.5 翻译西单人肉包子故事,翻译成英语/西语的时候,模型会报错,提示内容过于黄暴,模型拒绝生成,但是日语版本就没有任何问题。
说明什么?说明日语的语料真的很变态,间接可以说明日本人确实是全世界最变态的人。
大模型的意图理解,创作和推理能力,目前来看整体和人类的顶尖水平还是有较大差距的。
如果试图让大模型做一些“创造性”的工作,就需要非常强的提示词工程。
不同水平的提示词下,大模型的水平差异确实会非常大,但是我认为随着模型的迭代,我们的提示词对模型生成的结果质量影响会越来越小,主要的作用是提升精确性。
当然,如果两个模型有一些代差,生成的结果肯定是有质量上的差异的:
所以要不要对模型的提示词做大量优化呢?我认为这个取决于优化提示词的目的是什么。
如果是为了保证格式和输出结果的稳定性以及一致性,是很有必要的, 因为很多时候我们的产品业务上需要这个一致性,比如要求大模型输出的格式必须是 Josn,保证下游系统可以正常展示。
如果是为了提升质量,我认为是没有必要的,因为模型会升级,升级之后带来的提升肯定比提示词工程雕花带来的提升要多。
https://github.com/Kevin-free/chatgpt-prompt-engineering-for-developers
这是吴恩达的提示词工程课程,应该是目前市面上最权威的提示词工程课程,并且提供中英文双版本。
此外,长链路的 SOP、工作流和推理过程,我建议通过多个 AI Agent 实现,而非试图在一轮对话里面解决,原因在上面的局限性里面已经说的很清楚了。
如果这里有一个视频,希望 AI 总结视频的内容,应该怎么实现?
以 5.1K Star 的知名开源项目 BibiGPT 为例子。这个项目最早的一个版本应该是只做了一件事情(根据表现逆向猜测的),用 OCR 识别字幕,同时把视频转音频,ASR 出来文字,然后让 GPT 3.5 去总结。
项目地址:https://github.com/JimmyLv/BibiGPT-v1
当然更新到今天这个项目肯定不是做的这么简单多了,比如应该运用了大量的视频截图然后要求支持多模态的模型去识别里面的关键内容。
但是让我们回到 BibiGPT 第一个版本,它其实还是做了一个视频转文字的这样的动作。
这样的动作理论上来说现在已经没有必要做了,因为 Google 最新的模型 Gemini 已经支持对视频本身的解析了,只不过用起来很贵,下面是 Google 官方提供的 Gemini 处理视频、音频和图片的文档。
我个人并不建议大家在跨模态这个事情去做一些雕花的工作。因为用工程手段解决跨模态最大的问题是会造成信息的损耗。此外模型迭代一定是会端到端解决跨模态的问题的,我们应该重点解决上面提到的可能永远无解的问题,不要去和模型内卷,是不可能卷赢的。
但是需要强调的事,把一个博客网页的文本去提取出来转化成 MD 格式,或者把一个 PDF 转化成 MD 格式,这个不是跨模态,只是数据清洗,需要严格区分二者的关系。
数据清洗这件事情,最好还是用工程方法解决。
注:这一段会对麦克卢汉的《理解媒介》的基础上做一些发散;
想要理解大模型以及 AIGC 的商业价值,私以为最重要的是要能够首先理解媒介。
因为大模型生产的东西本质上是内容,想要能够对大模型有更深刻的理解,就要对内容以及媒介有比较清楚的认识,比起搞清楚大模型的本质是什么,我认为搞清楚内容的一些底层逻辑,其实对于应用大模型更重要。
对于产品经理来说,业务场景总是比技术手段更值得深入研究。
在讲述一些枯燥的概念之前,我想先讲一个关于媒介的小故事来方便大家理解。
在现实生活中,我们可能很难理解媒介的概念,但是在艺术界,媒介这个概念其实是被解构的很彻底,并且被比较赤裸地摆放出来的。
2017 年,知名的 MoMA 为史蒂芬·肖尔举办了一场个人摄影作品回顾展。
在回顾展的后半段,照片不存在于相框之中,展厅内部是一台又一台的 iPad,观众需要通过 iPad 观看肖尔使用 iPhone 拍摄并且发布到 Ins 上的照片。iPad 就是这些照片的相框。
媒介的作用就如同社会科学领域的议程设置一样,会深刻地影响所有人观看事物的方式。
肖尔的展览赤裸裸地把这个命题展现给了所有人。肖尔想通过这样的方式告诉大家,看一张照片,照片本身可能确实存在图像内容,但是让你通过 iPad 看,和让你通过打印出来的照片看,观看感受就是不一样的。
当你在博物馆看到一张照片,不论这张照片拍的有多屎,只要照片被很精致的打印,放大,挂载一面墙上,旁边再标上一个已经被拍卖的标签,看的人可能都会觉得,我靠牛逼,毒德大学!
当你在 Ins 上面刷到一张照片,你会觉得,哦,这就是一张照片。
现在肖尔在博物馆里面放一张照片,但是这个照片得用 iPad 看,这种强烈的反差会促使人们去思考,媒介对于内容究竟有多大的影响。
如果站在内容创作者的角度来看,现在生产了一个内容,希望它的价值被尽可能放大,是不是应该把这个内容输出到尽可能多的媒介上面去?
因为不同的人喜欢的媒介是不同的,同一个人在不同的媒介看到同一个内容获得的感受也是不一样的,这就是一个商业机会。
比如拍了个短视频,是不是最好抖音、小红书、B 站都发一遍?最好微信公众号再发一遍文字稿!
但是实际上只有头部的内容生产者才有资格做的这么细致,为什么?因为内容在媒介之间的转换是有成本的。
哪怕一个视频从抖音发到 B 站,对观众来说其实已经产生不好的观感了,因为一个是横屏一个是竖屏,一个是长视频一个是短视频,如果内容创作者要保持全平台最佳观感,其实成本是非常高的。
就我自己的体会来说,如果仔细看同一个内容创作者在 B 站和抖音发的视频会发现即使是一模一样的内容,抖音的视频普遍会被剪辑的更短。
最后,为了方便下文讨论,我会按照自己的理解对几个概念做简单定义,这些定义并不严格,仅仅作为本文讨论时方便使用。
每个内容在创作时都会自带一个原生媒介,因为人脑能够容纳的上下文是有限的,当一个作者在试图进行创作时,他必须要把创作的阶段性成果存储在某个媒介之上,并且这个媒介需要确保内容可以被再次输出以便作者做阶段性的回顾与质量检查。脱离了媒介作为存储介质,作者本人也无法理解自己曾经的创作。
所以我们也可以认为,一个内容是无法脱离于媒介独立存在的。
这种创作过程中就使用的媒介,我们通常称之为原生媒介,一个内容通常有且仅有一个原生媒介,当然可能会有辅助的媒介,比如一个广播演讲的原生媒介是音频,但是会辅以文字稿件作为补充。
一个内容只有通过原生媒介展示时才是能做到尽可能还原作者意图的,反过来也可以说,内容被发布到非原生媒介时会产生大量的信息损耗。
通常来说在一个媒介或者互联网平台内最流行的内容,几乎无一例外都是把这类媒介当成原生媒介的内容。
这也就是为什么抖音和 B 站的内容在互相转化的时候这么困难的原因。
B 站最早是一个网站,B 站的视频也是横屏的,因为看网站用的显示器天然就是横屏的,而显示器是横屏的原因是因为人类的两个眼睛是横着排列而不是纵向排列的。
抖音从诞生的时候就是一个 App,而且搭配了很多手机拍摄视频的功能,所以抖音视频天然就应该是竖屏的,因为人类用手机就是竖着抓的。
假如我们现在的主流手机不是 iPhone 定义的,而是日本的夏普定义的,说不定抖音就压根不会存在。
这种媒介上的区别就好像是难以逾越的天堑一般。
上面说的这些好像是常识,但是完全可以把这个分析思路套用到其他的内容上面去。几乎所有内容产品都可以在这个框架内进行分析。
一个看逐字稿会觉得是无聊对话的播客节目,听感有可能会非常出众,比如一些以“聊天”和“插科打诨”为卖点的播客节目,因为在播客节目中有语气和情感,这是文字稿很难表现的。
反过来说,假使一场广播演讲,演讲者根本没有用心关注内容,也没有通过演讲彩排做阶段性回顾,只知道逐字念稿,撰写演讲稿的人过分关注文字本身,这些就会导致演讲听上去干瘪无力,不如把演讲稿直接发给读者看来的更顺畅,因为这场演讲在创作时使用的就是文字而非声音。
在小红书上面,专业的脱口秀演员也会表达类似的观点,这些在道理上都是相通的。
优秀的演讲者往往会选择先写大纲,口播转文字再对文字进行调整,以此保证听众体验。
不同媒介之间的根本性差异在哪?
个人目前观察来看主要有两点,模态和瞬间性。
媒介=模态*瞬间性。
模态,人类与现实世界的交互模式,通常与感知器官有紧密联系,常见的模态有文字、静态/动态图像、声音等。
这三个基本模态根植于人类的视觉和听觉,锥体经验理论认为人类大部分学习过程都依赖于视觉和听觉,从这个角度来看,这些基本上的模态恰好被理论所命中。
当然这也可能是鸡生蛋蛋生鸡的关系。不同的模态自带的信息含量是不一样的,文字是最抽象的,包含的信息含量最低,而图像是最具象的,包含的信息含量最高。所以人们常说,看小说可以让人发挥想象,看电视剧则会被束缚,正是因为文字的信息含量低,所以才有想象的空间。
当然,这里的信息含量指的是“绝对信息含量”,比如文本文件就是比图像文件更小,但是这不代表念书学习效率会比看图效率低,因为人类能够摄取一个内容中的信息含量的能力是有限的。
好比和一个人交谈一定是比通过电子邮件交流具备更加丰富的信息的,因为这个人有微表情,有神态,但并不每个人都能获取和接收这些信息。
瞬间性是媒介的另一个根本特征,瞬间性是指对于一个内容来说,当它被某个媒介承载时,观看者回顾其中某一个内容切片的成本。
下面是一组媒介和他们的瞬间性大小的排布,瞬间性越强,回顾成本越高:
单张图片 = 短文字 < 组图 < 长图文 < 流媒体平台上的视频 < 播客平台上的播客 < 电影院电影 < 音乐会的音乐 < 线下脱口秀。
为什么线下脱口秀最难复制,因为它的创作过程都是伴随线下的灵光乍现以及与观众的亲密互动,人们再也无法踏入同一条河流。
对于单张图片来说,虽然想要 100% 复制有困难,但是至少可以基于特定工艺进行打印,然后在对应亮度和色温的灯光下观看,就能获得近乎于原作的效果。
瞬间性越强的媒介,对于情绪的要求就越高(对创作者和观众来说都是这样),一组文字可以冷冰冰,但是播客不能有气无力,并且这种媒介越可能要求创作者把创作和传播本身融为一体。
还是拿脱口秀举例子,脱口秀本身就是在舞台上才能实现作品的完整创作的,所以创作过程和传播过程本身就是一体的。
同时一个媒介越是强调编排,瞬间性就会被体现的越强,强调编排意味着读者如果跳着阅读或者跳跃回顾,都很难通过上下文获得相同的体验,只有完整的重新按照编排顺序阅读,才能获得接近于第一次阅读的体验。
在工作中其实我经常会有一个疑惑,为什么文档写了,还要问?
其实原因很简单,因为人作为一个媒介,比文档作为一个媒介对于人来说更加的友好。在某些场景下面提问者的问题是比较简单的,看文档就会很重。但是对于回答者来说,重复回答问题是不经济的,这种矛盾就很适合用 AI 来解决。
很多时候我们觉得一个内容读起来不舒服,可能不是内容本身的问题,而是这个内容的媒介导致的。
在英剧《是,大臣》中,汉弗莱曾经表示大臣的演讲就是很无聊,因为内阁大臣演讲稿撰写目标不是取悦台下的听众,而是上报纸。
所以为什么政客们在电视上的演讲那么无聊,这下大家都明白了吧,因为他们大部分在念一些“会以文字形式发下去”的材料。
理论上来说我们如果要让一个内容尽可能多渠道传播,我们需要有人去做这个媒介的翻译,并且这个成本非常高,举例来说:如果想要把一个以文字作为原生媒介的内容转化成播客录音,这个转化成本就会很高,因为这意味着在转化过程中需要增加额外的信息(比如语气和情感),这本身近乎于创作。
又比如对于一个公众人物来说,如果不针对性的做演讲训练,拿到一个演讲稿直接讲的效果一定会很差,因为撰稿人是基于文字媒介撰稿,而听众则通过声音这个媒介来接收信息。声音比干巴巴的文字稿会多出来更多的信息,语气、语速、抑扬顿挫等,这些如果指望演讲者临场发挥,那对演讲者来说要求真的很高。
因为如果一个内容的原生媒介的瞬间性很强,大概率意味着它会包含更多的信息,不论是编排层面还是情感层面。
但是现在,AIGC 很大程度上就能替代人去完成其中最枯燥的 80 % 的工作了。比如如何把一个文本转换成语音,可以用豆包 TTS 大模型,深情并茂。
在 AIGC 诞生之前,这是几乎不可解的问题,一定是需要人类录音的。
其实大概就在 1 年前,我曾经尝试总结大模型能做什么,当时总结的用途是:
一、总结:根据特定的要求分析大段的内容,并且按照内容给出对应的结论;
二、扩写:根据特定的要求和范式,将少量内容扩充成大段内容;
三、翻译:根据特定要求把一段内容无损的转化成另一段内容;
四、意图理解:大语言模型有非常强的意图识别能力,可以非常好的理解用户的意图;
这些总结不能说是错的,但是有几个比较致命的问题。
一、仅针对文字模态,没有考虑多模态的情况;
二、这更多的是一种归纳,并不能保证从逻辑上是 MECE 的;
如果从归纳法的角度来说,我们会认为大模型能干这个,不能干那个,可以举无穷多的例子,但是如果想要试图搞清楚这个东西擅长什么,不擅长什么,天花板在哪里,归纳法是没有那么靠谱的。
如果从媒介的角度去看待大模型,我们可以发现它具有几个能力是以前的技术不具备的:
一、它能够一定程度上理解内容,但是要想凭空创造内容还是有难度的;
二、它在理解内容的基础上,可以将一个内容修饰成另更适合一个媒介内容,也就是我们常说的总结、扩写、翻译;
三、它能够在理解内容的基础上,将一个内容转化成另一个模态的内容,也就是我们常说的文生图;
四、它能够基于自己对大量素材的学习,在内容进行媒介或者模态转化的时候,补充最合适的信息进去;
五、因为它进行了大量的学习,所以如果它能够被精确的控制意图,它的效果会非常好;
所以让我们回到上面的小节,回顾一下媒介的瞬间性的排序:
单张图片 = 短文字 < 组图 < 长图文 < 流媒体平台上的视频 < 播客平台上的播客 < 电影院电影 < 音乐会的音乐 < 线下脱口秀。
在 AIGC 诞生之前,我们可能只能把右边的内容转化成左边的内容。
在 AIGC 诞生之后,我们是可以把左边的内容转换成右边的内容的,因为我们有了无中生有的能力!
这就是 AIGC 在媒介层面的意义,这个从生产角度来说是划时代的。
还是拿上文提到的竖屏与横屏例子来说,B 站的视频是横屏的,抖音是竖屏的,对于创作者来说,如何低成本的转化呢?答案是用 AI 生成,扩展画面。
GoogleMind和普林斯顿联合发表了一篇论文《ReAct: Synergizing Reasoning and Acting in Language Models》,被公认为基于LLM的智能体的开山之作。
研究人员发现,在问答和事实验证任务中,ReAct 通过与简单的Wikipedia API交互,克服了推理中普遍存在的幻觉和错误传播问题。
这个比去强化模型训练强很多倍,原因是什么,大模型的大脑已经很强大了,很多时候再训练下去边际效用递减很严重,给他一个 API,相当于给这个大脑增加“五官”,它自然就一下子进化了。
AutoGPT 可以说是第一个真正意义上出圈的 AI Agent。
它尝试设计了一个流程,任何问题都有一个通用的元思路去解决,每个负责解决问题的模块都由一个 GPT 4 去驱动。
AutoGPT 的设计者认为这世界上几乎所有的问题解决步骤都是类似的,明确问题,明确解决问题需要的步骤,完成任务,检查,总结。
所以按照这个 SOP,他们涉及了一个互相之间传递信息的 AI Agent,每个模块都是独立记忆的模型,好像几个人类在分工,一个专门负责明确问题,一个专门负责拆解问题。
AutoGPT 是由Significant Ggravitas 于 2023 年 3 月 30 日发布在 GitHub 上开源的AI代理应用程序。它使用 GPT-4 作为驱动基础,允许 AI 自主行动,完全无需用户提示每个操作,因其简单易用在用户中大受欢迎。上线仅三周,其 GitHub 的 Star 数量已飙升至接近10万,早已超越了 Pytorch(65K),可以称得上开源领域star数增长最快的现象级项目。
Auto-GPT 是基于 OpenAI API 开发的,它的核心在于基于最少的人工输入/提示,利用 GPT-4 的推理能力解决更广泛、更复杂的问题。在具体的执行上,程序会访问互联网搜索和收集信息,使用 GPT-4 生成文本和代码,使用 GPT-3.5 存储和汇总文件。
但是很快大家就发现这个 AI Agent 是有缺陷的,比如它很容易陷入死循环,或者是不能很好的解决不确定性的,带有探索性质的问题,但是这个思路本身给大家带来了非常多的提示。
扩展阅读,Auto GPT 工作原理:
https://www.leewayhertz.com/autogpt
RAG 其实就是检索+生成的缩写,明确了这个 SOP 主要的作用就是从特定的地方检索出来信息,然后再以更加友好的形式展现出来。
如果一个产品有十几篇说明文档,那么 RAG 就好像是一个熟读了文档的客服。
最简单的 RAG 可以参考 AI 搜索引擎 ThinkAny 第一版的原理:
MVP 版本实现起来很简单,使用
NextJs
做全栈开发,一个界面 + 两个接口。两个接口分别是:
- /api/rag-search
这个接口调用
serper.dev
的接口,获取谷歌的检索内容。输入用户的查询 query,输出谷歌搜索的前 10 条信息源。
- /api/chat
这个接口选择 OpenAI 的
gpt-3.5-turbo
作为基座模型,把上一步返回的 10 条检索结果的 title + snippet 拼接成上下文,设置提示词,请求大模型做问答输出。以上文字引用自:
它 RAG 可以被视为是一种针对特定业务场景的 AI Agent,它和 AutoGPT 最大的区别在于三点:
发展到这一步,大家已经意识到一个事情:这个世界上可能不存在一个万能的 AI Agent,也就是说并没有一个万能的许愿机。
至少目前工程界很少有人会再尝试投人力去做万能的 Agent,学术界还在继续。
可能有人会纠结概念,RAG 和 AI Agent 是两个完全不相关的东西,而且 RAG 最早可以追溯到 2020 年的一篇论文,历史比 AI Agent 更为久远。但是其实我认为他们在工程落地上是非常相似的,都是强调基于工具,外部数据,存储机制来弥补 AI 的缺陷,唯一的区别是 RAG 不会强调要求 AI 具备自我探索自行规划任务的能力。
现在市面上的文章,尤其是面向非技术的同学的文章,关注概念多过关注落地,这不是一个好现象。工程领域本来就有很多约定俗成的叫法,比如广告系统的 DMP,全名是 Data management platform,但是实践的时候几乎只管人群数据,总不能因为名字和实际干的事有差别就天天在那辩经。
这篇文章在介绍 RAG 的时候,就是希望从实现思路着手,给 AI 这个大脑一步一步配上了多套工具,乃至到最后替 AI 做了一部分流程设计。
希望通过这个文档去展现一个循序渐进的,也是从抽象到具象的具体落地过程,为了保证文档本身的可读性,列举的项目并不是完全一脉相承的,但是我认为这样的写作顺序对于读者来说是最友好也是最具有启发性的。
论文《Seven Failure Points When Engineering a Retrieval Augmented Generation System》中列举了 RAG 的 7 个弱点。
论文地址:https://arxiv.org/abs/2401.05856
通过这些故障点,我们可以发现一个问题,其实有很多故障点本身和大模型没有关系,比如搜索文档 Top K 的排序不够精确,比如无法从文档中读取信息,因为文档格式错误或者文档太脏了。
就像我们前面所说的比喻,大模型本质是一个大脑,AI 产品才是大脑搭配上五官,躯干和四肢。
不能只优化大脑,不优化四肢,那是一种偷懒行为,不要把大模型视作为万能的许愿机器。
最后让我用一个儿歌来总结一下这篇文档的核心思想:
人有两个宝,双手和大脑。 双手会做工,大脑会思考。 用手又用脑,才能有创造。
Graph RAG 是微软开放的一个开源的 RAG 框架,可以被视作为是一种进一步变化和迭代的 RAG SOP,根据公开资料参考,我猜测这套技术实现思路广泛地应用在了微软的 Copilot 系统上,当然我没有找到可以证实的材料。
Graph RAG 和原本的 RAG 的区别是什么呢?
传统 RAG 的主要工作是这三个步骤:
整个步骤中只有第三步是使用了大模型的。
相似性查询的效果其实是比较不尽如人意的,因为它完全是根据文字的相似水平来进行检索,和文本的语义一点关系都没有。这就导致最终 RAG 的效果往往会比较糟糕。
当然这三个步骤中间出问题的可能性很多,就像上文提到的 RAG 的 7 个待优化点,但是检索的准确性是一个最容易优化并且收益也最大的问题,那么微软是怎么做的呢?
微软认为用户可能会词不达意,同时检索也需要更加智能,所以微软将向量化检索的方法替换成借助知识图谱的检索方法。
Graph RAG 的主要工作是下面三个步骤:
整体的步骤和架构其实没有更多的变化,但是在关键步骤上引入了大模型,作为两个独立的处理步骤。
注意,这里的独立处理步骤是非常关键的。
在微软发布了 GraphRAG 之后,很多人都试用了,然后又发现一堆问题,于是有人发了这篇论文:《A Hybrid RAG System with Comprehensive Enhancement on Complex Reasoning》。
论文地址:https://arxiv.org/abs/2408.05141
Hybrid RAG 在原来的基础上,做了几件事。
工作 1、Document 在 Loader 之前,先用 LLM 做一轮格式上的处理。
工作 2、问题分类机器
这个问题分类机器本身是一个 SVM 分类器,但是这个分类器的训练数据不是人工标注的,而是用大模型来标注的,以此减少成本和开销。
工作 3、利用大模型调用外部的计算库
当然,这篇论文里面还写了很多思路,感兴趣的同学可以自己去看论文。
这个论文质量还是很高的,6 个作者中的 5 个是北京大学人工智能实验室的学者。
现在人类生产视频的工业化流程是:
在大模型刚刚诞生的时候,其实有一个假设,假如大模型可以直接生成视频,能不能让它看抖音上的大部分视频,训练它,然后让它生产一部分。
让用户给这些大模型生产的视频点赞,大模型再把高赞的视频拿来作为正反馈继续生成视频。
如果这条路能走通,对于抖音这样的内容平台绝对是颠覆性的,现在看这个流程可以说是走不通的,其中自然有视频生成模型质量不好、不可控的原因,但是我认为更多的原因在于:
这两个是几乎无解的问题,估计未来相当长(10 年)的时间都很难解决,所以我不认为这种端到端的场景是可行的。
但是 AI 生成视频一定会成为视频工作者未来工作环节的重要补充,这点是不需要怀疑的。
显然不,因为这个世界上 90% 的事情用规则就已经可以运转的很好,模型低效又不稳定。
很多时候我们对一个产品的要求就是,简单、高效、可以依赖,现阶段模型的不稳定性注定了它在很多场景下是不可依赖的,哪就很难谈得上取代原有产品。
还是重读一遍俞军给的知名的需求公式:
用户价值= 新体验– 旧体验– 替换成本。
很多时候用了新技术,收益可能也没有想象的那么大,这是一个事实。认为所有应用都值得用 AI 重做一遍的人显然是高估了 AI,很多人喜欢把 AI 和移动互联网类比,这是不恰当的。
从冯诺依曼计算机的架构来看,移动互联网直接把计算机的输入输出设备给改了,这首先带来了交互上的革命性变化,但这不是最重要的。
从市场上来看移动互联网真正的价值并不是交互革命,而是极大的降低了用户接入互联网的成本,使得用户数量得到了翻倍,延长了用户互联网的使用时间。
上面这两个革命性的变革,显然是这轮 AI 浪潮所不能及的,AI 既不能扩大市场,短期内也不能改变计算设备的形态。
大模型的变革更多的会体现在生产端,从而影响消费端,正如在上文理解媒介一个章节中提到的,它能带来的是生产力的极大提升,但我们现在面临的问题更多的是市场不足,生产过剩问题。
有人说这一轮 AI 会带来交互革命,从今天起我们只需要一个有聊天框的超级 App 就可以啦!
我现在就可以下这个结论,说这话的人一定是云玩家,如果这种人在公司里面,我是他的上级,我就要惩罚他晋升答辩不准写 PPT 和文档,只允许口播。
任何一种媒介和交互都是有最佳实践和独特价值的,LUI 显然不是万能的,程序员写个代码还会考虑 IDE 的 GUI 好不好使,Language UI 信徒们哪来的自信这玩意可以彻底取代图形界面?
LUI 最大的问题就是效率低,让我以企业级软件举例:
Excel 也好,PowerPoint 也好,哪怕是 BI 软件也好,软件除了降低门槛之外,还有一个很重要的作用就是「约束」使用者。
在这个场景下约束不是一个贬义词,是一个褒义词。这些软件内置的所有功能都是在漫长的时光中迭代出来的,里面凝聚了无数软件开发者与使用软件的企业的经验和最佳实践。
打开 Sensors Analysis(神策数据旗下)和 DataFinder (火山引擎旗下)这两个产出自不同公司的行为分析软件时,会发现二者的功能极为相似,事件分析、漏斗(转化)分析、留存分析等等。我甚至怀疑使用这些软件的企业客户们使用习惯也会高度类似,因为这些软件里面凝聚的功能本身就是最佳实践。
对于一个没有什么统计分析能力的运营来说,让他去面对 GPT 的文本框描述清楚自己需要一个漏斗分析实在是太困难了,还是用神策比较简单。
GPT 如果能够获得关于漏斗分析的详细计算逻辑,也可以一定程度上的引导用户,但前提是用户得能说出来漏斗分析这四个字,实际上脱离了界面很多人都不见得能描述的清楚自己想要的是什么。
LUI 不是万能的,对 LUI 的过度追求,甚至把 LUI 与 AI native 划等号这种想法都是错误的。LUI 只是在特定范式下才是有意义的。
现在市面上最领先的开源文生图 UI 叫做 ComfyUI,如下图所示:
ComfyUI 和我们脑子里面想的敲敲文本就能调用的文生图 AI 差异很大,感觉更像是一个低代码平台,为什么?
因为在工业界需要追求精确控制,纯粹用提示词是无法准确表达精确控制的语义的,必须得用 GUI 才能表达出来。
比如上面这个图,其实里面做的事情就是把一个建筑物换成另外一个建筑物,并且尽可能不要改变其他东西,这种精确控制对于模型这种本质依靠数学概率驱动的东西来说是非常困难的,所以才搞得这么复杂。
那么问题来了,上面这种 UI 是一段弯路吗?
其实我乍一看我也觉得这个太离谱了,如果让我用 Photoshop 或者醒图类似的事情应该也能做,而且 UI 应该没有复杂,但是细想之后我认为这个东西非常有价值。
我认为如果把这种 UI 给到用户,这肯定是一段弯路,但是如果我们把上面这个操作包装成一个场景,给用户的就是让用户上传两张图这样的动作,这不就是一个最简单的产品了吗?
也就是说我上面说的,醒图和 PhotoShop 的功能,其实以后完全是可能用这样的 UI 搭建出来然后包装给用户的。
所以上面的 UI 是完全可以提供给专业用户的,这样的 UI 可以变成一个引擎,产品内成千上百的功能都可以通过这么一个元引擎被源源不断地生产出来。
这就是大模型真正的价值,这是生产力成百倍的提升。
如果大模型既不能给交互带来质的变化,又不是一个万能的许愿机,甚至连端到端生成 Feed 流都做不到,那么大模型真正的价值是什么呢?
大模型真正的价值在于给产品经理和工程师这样具备非凡创造力的人一个增幅器。
这是一个不需要训练的万能模型,而且大概率比专属模型更强。
这意味着产品经理和工程师只要能想清楚 SOP,想清楚哪些问题可以用大模型来解决,就一定能以比较低的成本解决,原本一些需要训练自己私有模型的事,现在依靠公有模型就可以解决了。
很多原本像高山一样的成本,现在也是可以逾越的,金钱和数据量不再是训练模型的拦路虎,你只需要会写 prompt ,会搭工作流就可以了。
新鲜的数据和能持续产生新鲜数据的业务,是一个大模型的生命力所在。
一个 RAG 做的再牛逼,如果数据库很糟糕,结果就是很糟糕的。
一个模型再挫,只要数据足够好,照样是一个好工具。
在 AI 时代,数据的问题只会被放的更大,AI 搜索如果在一堆屎山数据里面做搜索,充其量不过是又造了一根搅屎棍。
任何时候,能持续生产真实交易数据和优秀内容的业务都比大模型本身重要。
我认为一个比较清晰的事实是,目前工业界短期内一定高估了大模型的作用。
前段时间我写了一个段子:每一个 App 都值得思考是否能用 AI 重做一遍,然后就会发现值得重做的只有 10%。
短期内的资源投入很大程度上是源自于投资人和大厂决策者的 FOMO 心态,这种心态某种角度来说是不健康的。这种 FOMO 的心态也会传导给产品经理,于是很多产品经理都开始看论文(比如本文作者),但在我看来产品经理看论文其实没什么用,图一乐的作用更大。
论文都是锤子,但是对于 PM 来说更重要的是钉子在哪里。所以与其关心最新的学术界又发了什么,不如关心一下 Product Hunt 上面哪些 AI 产品又登上了当日第一,并且赚钱了。
与其 FOMO,不如动手多用用,以前移动互联网刚刚兴起的时候,大部分产品经理手机里面不得装小几百个 App,天天研究来研究去的。去用一下市面上最好的应用,并且尝试逆向它,会有多很收获。
写这篇文章,写接近 2 万字,发现大模型那么多的坑,而且每个坑都能找到一些关联的论文。不是因为闲的蛋疼去看论文,而是因为一直在捣鼓 AI,然后发现这也有问题那也有问题,不得已去搜索,搜到了论文。
原来大家都有这个问题,有的人就是有钻研精神,发现了问题还会深入研究,然后写一篇论文。哎,人比人真的气死人。
如果仔细看就会发现我看的大部分论文都是工程师论文而不是算法论文,因为就像我强调的,大模型的弱点需要工程弥补,工程是研发和产品经理共同搭建的,看不懂算法的论文不打紧,看不懂工程师的论文可能真的得反思一下。
正如文提到的,未来 AI 产品团队的能力,不取决于谁家模型更强,反正开源模型一定最终会变得最强,而取决于谁家能用好 AI 模型。
而谁能用好 AI 模型,又取决于哪个团队做实验的本里强,谁能更快的做完更多的实验,谁就牛逼。
有的人可能会问,我用 coze 或者是 KimiChat 行不行,我的答案是不行。
因为这两个本身就已经是 AI 产品了,和 AI 的 API 差距很大,给 KimiChat 传个 PDF,人家解读的又快又好,你怎么知道它解读的好是因为模型牛逼,还是因为 PDF 格式转 MD 数据清理的好呢?
这就需要产品经理必须要具备非常快速的裸调用 API 做实验的能力。
那么不会写代码,怎么快速获得这种能力?用 Dify 或者 n8n 这样的低代码平台来解决。
就我自己来看,我认为 n8n 更靠谱。n8n 是一个 Coze 的开源免费上位替代,一个可视化低代码自动化 Workflow 平台,能够方便的让不会写代码的朋友体验 AI 开发的乐趣和效果。
用它可以轻易的创建很多扣子完成不了的复杂自动化 Workflow。比如 Webhook 触发,比如 1000 多种第三方接入,比如发起自定义的 HTTP Request。
并且因为 n8n 不是从这一轮 AI 浪潮才开始做的,所以它的生态也比这一轮 AI 后才涌现出的 Workflow 工具(比如 Dify)更完善,官方接入的集成服务更多,社区更活跃。
n8n 就是大模型的五官、躯干和四肢,动手又动脑,才能有创造。
在这里我推荐一个 n8n 的中文教程《简单易懂的现代魔法》,这应该是目前市面上最好的 n8n 中文教程。
想象一下 20 个实习生帮你干活,你要怎么分配任务?实习生的特点是什么?
所以如果你把 AI 视作为一个又一个不知疲倦的实习生,你认为他们能干嘛?当然是设计好 SOP 和产出物标准,让他们去做这些量大且重复性的工作啦。
当然实习生和 AI 有一个比较大的差别,就是 AI 确实比实习生,甚至不少正式员工在解决特定问题的时候强很多。
也贵很多,GPT-4 回答一个问题一个来回 API 的定价可能在 3 美分左右。
人比机器便宜,可能是未来大家不被 AI 淘汰的重要理由(bushi)。
把一个复杂问题拆成多个简单问题,然后再让模型处理有两个好处:
第一、正如上文所描述,大模型的不稳定性和它接收的文本规模大小完全是呈正相关的,如果把问题拆小就意味着单词任务模型要处理的文本变少。
第二、一些简单的问题根本没必要用大模型,甚至可以用简单的模型或者是纯逻辑去判断,更便宜、速度更快,甚至效果可能会更好。
以 Grpah RAG 架构为例子, 它一共分为三个步骤:
其中前两个步骤是离线任务,离线任务意味着可以花费较多的时间对数据做精细化的处理,比如我们可以用一个开源但是性能强悍的大模型,用自己的服务器去跑任务,以此来在保证质量的时候降低成本。
而在线任务则意味着需要较强的时效性,如果在线任务本身复杂度并不高,也可以选择更加轻量级的模型来保证回复速度。
同时离线任务的结果会被存储并且反复调用,用质量更好的模型相当于做了一些固定成本的投入,而在线任务都是和用户交互直接相关的,这些本质上是边际成本。
在 Hybrid RAG 中,对 html 转 MD 的工作用的是 Python 库进行的,其实这项工作如果纯粹追求效果的话,完全可以考虑直接用大模型来做。
当然具体是用 Python 库还是用大模型,其实是取决于成本和效果的考量的,这个也需要通过实验来证明。
我自己的经验是这种数据清洗的工作适合用 Python 库做一轮,再用大模型做一轮清洗,效果可能会更好,但是很多时候 Python 库已经足够干净了,中间夹杂一些错误的格式编码其实也不影响后续大模型的判断,这种情况下做不做都是无所谓的。
总而言之大模型在特定环节的工作能力是非常强的,如果不是考虑成本,其实几乎每个环节都可以用大模型解决。
众所周知,大模型回答有一定的随机性,要怎么解决这个问题呢?当然是一个问题重复问几遍啦。
比如论文《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》中提到的如何测试两种 RAG 方法的效果,用人力标注太麻烦了,所以他们连检查样本的工作都交给大模型来做了,真是牛逼(有钱)。
为了保证结果正确,一个标注要重复做 4-5 遍,成本自然也是 4-5 倍。
对于设计产品的同学来说就非常需要判断成本和效果之间怎么平衡了。
如果我们把提示词工程、Agent 的建设和模型微调对应到我们给一个人布置任务,就可以这么理解。
所以完成一个任务,可能三种手段都需要用上,但是三种手段的成本是不一样的。
而为了完成一个任务,应该用哪种优化手段,这就是目前工程、算法、产品、学者这几方面都非常模糊的地方,这个就好像是在航海或者挖矿,又像是临床医学,怎么决定用什么手段,本质上是一个“实验”,而不是一个“推理”。
这也就是为什么上面列出来的每一篇论文都需要列非常多的基准测试,因为设计这些 Agent 的人自己都不知道结果到底好不好,需要实验才能验证。
所以我认为,未来哪个团队应用 AI 的能力强,哪个团队应用 AI 的能力弱,其实就取决于:
谁实验做得快,谁就牛逼,工程化产品化反而是最后一步。
最后我个人建议是能不要微调,就不要微调,因为微调会改变模型的参数层,成本很高而且无法迁移。而且微调的本质是在和大模型团队卷算法,卷数据,内卷在长期来看,是没有意义的。
2024-08-26 00:44:57
最近有一个户外品牌“蕉下”裁撤了自己的市场部上了行业新闻,很多市场、品牌口的同学都纷纷在表达自己的意见。
碰巧最近因为工作关系,我需要去花时间大量的研究如何从数据层面证明品牌建设,品牌广告投放这件事情的效果,于是把自己的一些思考写在这里。
我不是一个营销方面的专家,但是对数据和推荐系统本身还是有一定了解的,所以就抛砖引玉一下。
品牌广告的定义是什么?其实核心是按刊例付费,多少曝光量,多少广告位,就收多少钱,曝光量是硬指标,是打包卖出去的,是库存,对于平台来说是旱涝保收的,但是因为不承诺效果,平台之间会打价格战,对于品牌方来说,广告费可能会打水漂,也可能不会,非常需要卷创意。
其实在互联网诞生之前,实际上所有的广告都是品牌广告,因为当时没有效果可以衡量。
而效果广告则是按照效果付费,这个效果可以是点击,可以是留资,也可以是交易,总而言之广告主只需要为了最终的转化效果付费即可。
这回就轮到广告主旱涝保收了,平台于是提出了竞价系统,简单的说就是广告主可以只为了效果付费,但是如果单次效果给平台付的钱很少,平台就不提供曝光了,价高者得广告位。
所以很多时候效果广告和竞价广告是可以划等号的,或者可以说竞价系统就是为了效果广告而生的。原则上来说品牌广告也可以用竞价的方式进行,但是实践的时候在国内这并不是主流操作。
因为效果广告可以直接带来销量,可以很容易衡量 ROI,所以业界一直有一个疑问,是不是我只投效果广告,不做品牌广告甚至不做品牌建设,也是可以的?
效果广告的支持者们通常会认为品牌广告就是骗钱的,因为看不见数字,所以品牌广告的从业者们就自然而然的想到了一个自救的办法,那就是想办法度量品牌广告的效果。
当前行业通行的做法,在我看来是品牌广告效果化。
为了度量营销的效果,小红书和抖音都推出了 5A 模型,5A 模型是源自于“营销大师”科特勒的一个理论,他把人群划分为Aware(意识)、Appeal(吸引)、Ask(询问)、Act(行动)和 Advocate(倡导)。无论是投放品牌广告还是效果广告,投放的 ROI 最后都会落脚在 5A 的人群数量的变化上。
说句不好听的,就是放一些原来大家没那么关心的指标,用来凑 PPT 门面。
但是这个做法有一个天然的问题,如果效果广告把 5A 背后的用户行为作为优化目标,是否可以认为 5A 的每个指标都是为效果广告服务的。
Aware 代表曝光次数,Appeal 代表点击,Ask 代表留资或者加购,Act 代表成交或者下单等等。
效果广告不在乎量,只要单次点击 ROI 足够高就可以了,而品牌广告还有一个保量的逻辑,从机器学习优化的角度来说,效果广告是为单一指标优化,品牌广告则不是。
所以效果广告的效率天然高于品牌广告,而用 5A 模型去衡量效果广告的效果,因为效果广告在投放的时候就可以把 5A 的指标直接定义为优化目标,其实就等同于在用效果广告的指标衡量品牌广告,那么无论怎么自证,效果广告的效果都是更好的。
如果用 5A 人群去衡量偏品牌的投放,其实就相当于天然在用一个效果指标衡量品牌建设,这个是在逻辑上就天然让品牌广告站在了弱势一方的一种做法。品牌建设强调的是调性,是心智,然而最终还得用覆盖人数去衡量,这显然是不对的。
一种天然的劣势的度量方法,是导致经济下滑的情况下市场部不好过的最主要原因。经济下滑,讲故事行不通了,得讲数据,讲数据又直接基于一个天然有劣势的指标沟通,后果可想而知。
解法是什么?让我们假设这个社会的人都是理性人,品牌方建设品牌的目的是什么?
要回答这个问题,首先得回到一个更加基本的问题,交易的成本问题。
我选择一个商品,除了我为了购买这个商品本身付出的成本,还有我决策要买这个商品要付出的决策成本。简单的说要买个充电宝,是买个杂牌的好呢,还是买小米的好呢?
其实理论上来说只要大家都是国标,都没有虚标,卖谁都是一样的,但现实生活中会有人这么决策吗?显然充电宝这玩意没几个人敢买杂牌的。原因很简单,我们生活在一个真实世界,而不是真空球形世界,不是一个物理上理想化的世界。
如果要买一个杂牌的充电宝,对这个充电宝的自行质检的成本,或者是了解充电宝行业,从而选出优质杂牌的成本,是远高于直接购买小米充电宝的成本的,这就是交易成本,交易成本的本质是交易决策的成本。
无法降低交易成本,是效果广告最大的问题,效果广告因为是完全围绕单一指标优化的,所以它的模型一定是假设这个世界就是一个“真空球形”的世界,不然为什么会有那么多货不对版的游戏广告?就是因为那样子做点击率高,点击率高模型就觉得这是好广告,加大投放量,实际上进去都是假的。
一个只有效果广告的世界,交易成本一定是远高于一个效果广告和品牌广告并存的世界的,因为品牌最大的价值就是降低交易成本。
我们可以做一个非常粗暴的指标,一个品牌商品的价格减去相同规格的白牌产品的价格,就是这个商品因为品牌带来的溢价,溢价包含品牌额外的利润和客户的交易成本。如果交易成本其实很低,远低于品牌额外获取的利润,那这个商品往往就会被称为智商税产品。
而如果一个商品的溢价几乎等于客户的交易成本,甚至远小于客户的交易成本,这类商品就会被称为“质价比”商品。
品牌对于消费者的作用是降低交易成本,对于品牌方来说作用就是赚钱,销量不变的情况下如果可以依靠品牌预算的投入带动价格上升,何乐而不为呢?
所以衡量品牌广告到底有没有用,不能光看 5A 人群的情况,这个本质上还是把客户的交易成本计算出来,同时把品牌的商品和市场上同规格的白牌的商品拿到一起比较溢价水平,溢价减去客户的交易成本,数额越高就说明品牌建设越成功。
交易成本是一个很复杂的人心问题,它不是靠效果广告模型能够优化的,模型更适合优化指标明确,甚至指标唯一的问题。
落到具体的计算口径,交易成本可以依靠平台的转化率,搜索情况来做一个计算,比如某一个商品平均的决策成本是怎么样的,用户会进行多少次搜索和商品的比较完成一次购买决策,然后把这个购买决策计算出一个系数,和商品的均价做一个乘法从而把购买决策货币化。
与同规格的白牌商品比较溢价水平则可以依靠平台整体计算的行业同规格商品售价作为基线来进行。
如果度量出来,发现品牌投入对商品溢价的提升是非常有限的,那就说明要么是市场部太菜了,应该换人,要么就是这个市场的交易成本已经非常低,没有投品牌广告的必要。
比如 PC 组装机市场就是一个信息非常充分流动的市场,所以品牌广告甚至是广告本身几乎都是没什么用的,显卡芯片都是英伟达的,你们几个显卡厂谁东西好谁东西差跑个分就行了,有什么溢价空间可言?
说穿了品牌广告也好,效果广告也罢,最终的目的都是为了 GMV 上涨。那么效果广告更适合做的事情就是直接转化,而品牌广告适合做的事情就是提升溢价空间。
让品牌广告做起量的事情也不是不能做,但是这就意味着这两个类型的广告注定会内卷,而效果广告是一定会胜出的。因为效果广告只需要为效果负责,品牌广告需要兼顾保量,首先在定价上,效果广告肯定更占优。
如果站在平台视角,同样的广告位肯定是希望卖的更贵,这就是效果广告搭配竞价系统的逻辑,于是品牌广告只能选择锁定一个对平台来说收益可以接受的价格。
但是这对于广告主来说就很难接受了,不承诺效果还卖一个价格,雪上加霜。
而广告位是有限的,在这个前提下,平台就会玩命优化效果广告的机器模型来赚取更多的广告费,优化到最后的结果就是都没几个广告位置留给品牌广告,品牌广告只能死的更惨。
有的人可能觉得自己是广告创意大师,没事的,不会被机器卷死,这种想法我只能说,你开心就好。
最后我说的这个方法也有弱点,第一个弱点是它不是一个灵敏的指标,因为品牌建设本身就是长期的事情,所以对品牌建设效果的衡量指标注定不是一个长期指标,第二个弱点是它很难归因如果最终溢价获得提升到底是因为哪个动作产生的效果。
此外这个方法对于像 iPhone 这样具有护城河的产品也不是一个很好的衡量指标。
但不妨碍可以按照这个思路尝试去做一下。
反正做不做都要被裁了,不妨试试看呢?
2024-08-21 10:27:32
整个 2024 年上半年,各大电商公司以围攻光明顶的方式试图打破拼多多的低价护城河,就目前的情况来看这些努力都可以认定是失败的。
阿里和抖音分别都在不同的场合透露出将会放弃把低价视作为最核心衡量指标的工作方式,转向更加多元的价值度量方法,并且将逐渐放弃仅退款等极端运营措施。
这也意味着拼多多甚至可能没有花费太多力气就保住了自己最核心的竞争力。
坦率来说我并不认为阿里的价值观完全向拼多多看齐之后会有多么美妙的结局,毕竟阿里曾经已经经历过对商家实施过激政策然后导致群体性事件反噬的先例——淘宝十月围城。
一家公司在没有搞清楚拼多多一些深层的业务背景的前提下贸然模仿拼多多的策略,比起能够击败拼多多,自己遭到反噬的可能性会更大。所以阿里和字节放弃低价策略某种角度来说并不是坏事,无论是对他们自己还是对他们的用户来说。
拼多多作为一家电商公司最大的创新在于找到了中国“沉默的大多数”,可以说拼多多就是电商界的懂王。
让我们分别从供给端和需求端对比一下阿里与拼多多的差异。
2011年,淘宝发生了一起“十月围城”的事件,起因是阿里陡然间提高了“淘宝商城”(就是未来的天猫)的技术服务费和违约金金额,在这项规则中,受伤最严重的是“中小商家”,而平台和“品牌商家”一起都成为了被攻击的对象。
根据中国互联网络信息中心(cnnic)发布的《第 29 次中国互联网络发展状况统计报告》,2011年年底,中国网民规模突破5亿,更值得一提的是,2011年末常住人口城镇化率首超50%。
考虑到淘宝日常因为“低质商品”的问题被围攻,而中国的城镇化水平和网民增速已经过半,阿里的整体发展策略其实就是在供给端上加强于大品牌大商家的联系,重点监控打压低质商家,在需求端上面,跟随中国经济发展的脚步,只要中国城镇化水平进一步提高,网民人数进一步增加,阿里的市场占有率就会逐步攀升。
然而有一个事情是超出了阿里的预期的,那就是即使到了 2017 年,淘宝的活跃用户数也只有微信的一半。也就是说在不少新网民的手机里面,微信=移动互联网,移动互联网=微信。
凭借和微信良好的关系,拼多多就这样获得了第一桶金。
2017年年初,拼多多首次进入到了Talkingdata的监控榜单里面,按照活跃水平统计进入中国 TOP 200 的水平,此时的拼多多别说和淘宝掰手腕了,就连唯品会可能都不见得会把它放在眼里。
但其实此时此刻拼多多已经通过微信获得了大量的“水下”用户,而这部分只用微信的用户,是其他电商平台永远接触不到的。
不过即使到了拼多多被人注意到的时候,阿里仍然认定拼多多的作用在于帮助阿里教育市场,坦率来说阿里的判断不能说全是错的。
如果中国经济持续走高,城镇化水平继续高速增长,达到或者接近发达国家 80%甚至是90%的城镇化水平,拼多多可能真的就是在帮阿里教育市场,可实际上 2023 年的城镇化水平是 66%。
在分析拼多多的时候,很多人会更多关注百亿补贴的打法,但是拼多多的基本盘从来没变过。
在供给端,他们承接了阿里通过政策清退的商家,在需求端,他们链接了一部分足够下沉的市场。一线城市的媒体会报道拼多多是“消费降级”巨头,但其实拼多多对于它的基本盘来说可能真的是“消费升级”。
就好比原来市面上没有足够多的出租车可以供应,大家只能打黑车,现在有了网约车,可能和电叫的出租车相比确实差了一些,但是至少比黑车强多了。
拼多多现在的价值观,低价格力的核心护城河,本质上是被市场所塑造的,并不是一蹴而就的。不是拼多多压榨了供应商拿到了低价,才拿下农村市场,而是拼多多一直就在做四五线城市以及农村市场,所以才越来越低价。
低价的商品可能低质,但是只要卖给对的人就不是什么大问题,反过来淘宝和抖音的客户群是压根不可能忍受这些商品的,这也是拼多多合规成本低于竞争对手的直接原因。
所以拼多多的核心的成功原因是找到了自己在这个市场的生态位,这个生态位的需求方恰好是阿里一时半会没能触及到的,而供给方又被阿里自己主动给清出了,不是靠纯粹的低价,低价可能是结果,但不是原因。只是当一个循环被建立之后,这个循环的因和果就很难被拆分清楚了。
那么为什么到了 2024 年,拼多多突然走进了风暴眼中呢?
因为2024年大家的经济压力更大了,改革开放以来中国人有一个习惯,就是遇到问题先看一眼日本。考虑到中国已经摸着日本和新加坡过河摸了 40 年,对于日本踩过的所有坑全中国上下都是极力避免的,从官员到普通市民几乎有人都在拿放大镜审视日本。
2024 年上半年,突然有人翻出来一篇10年前的日本报道《优衣库型通缩,导致日本沉默》。与之对应的是中国互联网突然出现一篇爆红的文章——《拼多多越好,时代越糟》,我并不完全认同这篇文章的观点,所以建议感兴趣的朋友自行搜索阅读。
两篇文章的核心观点就是拼多多这样的企业太卷了,把市场环境搞得越来越恶劣,劣币驱逐良币了。这是一个很严重的谬误,那就是因果倒置。优衣库没有能力让日本通缩,是通缩的日本才让优衣库大放异彩。拼多多同理,拼多多没有让中国制造业更加卷,中国制造业本来就很卷。
哪怕没有拼多多,中国制造业依旧卷得惊人,2013 年,国务院发布了《关于促进光伏产业健康发展的若干意见》,重点要求解决我国光伏产业存在产能严重过剩、市场无序竞争的问题。
彼时拼多多还没有成立,中国光伏产业就已经内卷到需要国务院来发文制止恶性竞争。
而且制造业内卷的现象并没有缓解,这些年中国制造业高端领域不断突破,每次突破,全行业价格都下降一个档位,卷了全世界,搞了个称号叫“发达国家粉碎机”。我是不知道这个称号有什么值得沾沾自喜的,这不就等于我们辛辛苦苦突破了关键技术然后又要给全世界打白工么?
搞产业升级的目的应该是让中国人过上美国人的日子,而不是反过来让美国人过中国人以前的日子。(虽然也不是不行)
拼多多没有能力让制造业企业内卷,是内卷外溢到了拼多多这个平台上,拼多多固然是受益者,甚至是施加了影响力的一方,但这不代表它是始作俑者。
原本制造业的卷是在自己个各个行业里面,甚至是企业级采购里面的卷,这些是隐性的,不被人关注的,同时可能还是充满了潜规则的。拼多多把这个内卷的竞争形势给更加算法化,系统化和平台化了。
竞争也从行业性,地方性的变成了全国性的竞争,也从供应链的角度前移,一部分消费者需要直面消费者,这也是一种压力的增加。
到了 2024 年,大家日子都不太好过,急于找一个替罪羊出来,于是拼多多就走上了风口浪尖。从这个角度上来说,拼多多是什么?拼多多的其实就是历史课本里面那个用来承接牛奶的阴沟。
哪有牛奶卖不完怪阴沟的道理?
况且比起强制清退产能,市场层面直接破产清算,拼多多对于制造业的卷是更加温和,也是更加仁慈,甚至更加缓冲的。是一种渐进的,切香肠式的化解落后产能的方式。
有人指责拼多多对供应商切香肠,今天切一点,明天切一点,问题是供应商被切了啊,如果这个价格是刚性的,不卖不就完了吗?如果是自己无法提供有竞争力的价格,那不就是活该被淘汰咯?
某种角度来说拼多多是真爱国啊,为国当阴沟,还主动背起了化解落后产能的大锅。
还有一种反对的声音,就是拼多多这种不给供应商留活路的做法,会阻碍中国产业升级。逻辑也很简单,企业没有利润空间,没有利润空间就没有研发投入和品牌投入,自然就阻碍了产业升级。
这还是一种因果倒置,且不说供应商在有了利润之后会把多少钱用来给工人发福利,多少钱用来研发,多少钱用来做品牌建设。就算有一家企业价格比竞争对手贵 10%,利润都用来做研发了,最后还是在竞争中失败了,能说明什么?
只能说明它让消费者多付出的 10% 的价钱都喂狗了,技术投入没有在产品上形成优势,被对手用区区 10% 的价格差就打败了。
同样的,如果一个大品牌打了10年广告,最后商品的成交详情页的转化率只是略高于同等水位的白牌,说明什么?说明市场部就应该全员自裁。
给品牌投入,给研发投入,给工人好的福利待遇,最后的目的都是为了带动销量,提升单价,最终带来利润,谁也别装大尾巴狼说自己是为了社会,为了产业升级,你配么你就那点雇员数量。
如果研发投入的 ROI 不如降价来得快,只能说明研发菜,菜就要认,技不如人就要甘拜下风,乖乖回炉重造重新卷。
拼多多只是在排序逻辑上给了价格非常高的权重,如果一个产品真的是品类上是独一无二的存在,排序逻辑不应该会影响它的销量,恰恰是因为产品品质不够硬,品牌不够硬,才需要依靠平台的排序逻辑。
如果品牌够硬,消费者搜索关键词直接就是品牌词,还有排序什么事吗?如果产品功能足够硬,功能关键词就是独一份的,还有竞品什么事吗?最关注排序逻辑的,恰恰是最菜的那一批。
只不过是因为拼多多把竞争摆在台面上了,就觉得这一切都是拼多多的错,这不是胡扯么?
非要说拼多多有什么问题,那最大的问题我觉得肯定是安全问题,或者说是商品质量问题,作为平台,拼多多到底到底能不能保证线上售卖的商品,做到货对版,安全层面符合国家标准。
不过安全投入低这个事情,拼多多只能负一部分责任,更多的责任还得消费者自己吃进,当一个人在拼多多买 60 块钱 200 瓦的氮化镓充电器的时候,难道就没想过这玩意这么便宜不会爆炸吗?总不能别家卖 200,300 块钱都是再割韭菜吧,就你买 60 块钱的最聪明?
喜欢既要又要还要,最后就是什么都得不到。所以说如果一个人,津津乐道于中国是发达国家粉碎机,热衷于购买拼多多上的廉价商品,那么这个人指责油罐车运食用油时,是没有道理的,活该吃油罐车运的食用油。
因为我们不是活在一个真空球形的世界,现实生活中的每一个步骤都是概率的,都是可能会犯错的,这些错误的累计最终就会导致,所有的安全与质量都是需要额外的成本去维持的。
不过拼多多在合规层面的投入没有竞争对手多这个现象也是存在的,上图是晚点整理的三家电商资质审核要求。
没有一个强有力的监管政策托底,没有社会层面对质量和优质品牌的支持,在经济暂时疲软的情况下就是很容易发生劣币驱逐良币的事情。
所以核心的问题是监管层面要尽快检查拼多多售卖的产品是否都符合国家最低标准,拼多多也需要加大产品质量的抽检力度,不要用仅退款代替平台的预置检查。
当然加大了合规投入之后,拼多多还能不能维持现在的成本优势就是另一个问题了,不过就像我上文说的那样,如果一个供应商被拼多多卷死了,那么这个公司本来就该死。反过来说,如果加大了合规投入,拼多多就会被阿里卷死,那拼多多就该死。
不合规不能成为一个公司的竞争力,一个好的社会应该要求同一个赛道的企业都在完全一致的合规标准下进行竞争。
但是总不至于真有人会觉得拼多多加大了合规力度就会倒闭吧?那拼多多也太菜了,我是不相信它真的这么菜。
你呢?
注:如果你对本文的观点不太认同,不妨阅读一下我的另一篇稿件《互联公司变平庸的原因:不够爱国》,然后回过头来再阅读本文,相信会有全新的视角。
2024-06-26 00:53:00
截止到 2024 年 6 月底,我一共去了 6 个城市旅游。
他们分别是天津蓟州、金泽、朔州、呼伦贝尔、满洲里、保定。其中呼伦贝尔和满洲里是在一次自驾里面路过的两个城市。
相比第一季度少了很多,因为 Q2 去上海出差了很久,而且中间有一个母亲节,需要回家陪老妈,所以整个第二季度至少有 3 个周末是在苏州度过的。
我爸妈无情拒绝了我周末江浙沪周边游的盛情邀请,二季度出游的机会自然比第一季度少了些。
考虑到金泽是苏州的姊妹城市,某种角度来说也算是回家了(笑)。
天津蓟州的旅游发生在 2024.3.30,算是Q1的尾巴,但不知道为什么 Q1 的游记写漏了。
考虑到我实在是太喜欢金泽了,为了保证一种形式上的美感,我不想在游记的一开始就写它。
我们去的是天津的盘山风景区,没有去独乐寺我自己觉得自己都有点大病,但是方向盘不在我手上。由于同行的人里面有一位胖子,实在是体力不支,盘山也是没怎么玩的,就跑到天津一个不知名的村子开始搞起了行为艺术。
中途的时候发现有一个水库,很想进去看看,但是被保安大叔拦住了,说是水库旁边危险。
几个人商量了一下,产生了如下的对话:“哎呀你看我们大老远跑一趟也不容易,大爷你看你在这守着也很辛苦。”
塞了点钱。然后大爷说:“好的,注意安全。”
晚上在蓟州本地的一个餐馆吃饭,先不说饭菜好不好吃,我发现一个很有意思的事情,就是蓟州虽然已经撤县划区很久了,但是大众点评上面,还是独立的一个区域。
也就是说从大数据的角度来看,蓟州和天津的经济联系是比较微弱的,同理,苏州的昆山、常熟、张家港、周庄、吴江也都是这样,尽管吴江地铁都通了。
大数据真奇妙啊。
金泽,日语发音是 kanazawa,和日语的钱(okane)是谐音。
金泽号称小京都,不过考虑到中国有几十个小清华,日本自然也有非常多的小京都,而且坦率来说,金泽的知名景点并不是它最出彩的地方,这块我在下文会详细阐述。
在中国游客的认知里面金泽不算是知名旅游城市,我的高中同学在金泽大学留学,再加上金泽是苏州的姊妹城市,所以注意到了这个位于北陆地区的小城市。
本以为这次去金泽没什么人,虽然是赏樱的好时节,但金泽不是热门旅游城市,不曾想欧美游客竟然意外的多,据说是因为日本面向欧美宣传旅游的时候,很喜欢搞一个一条龙的线路,金泽恰好在这个线路的后半段。
关于金泽的景点哪好玩,哪些小店值得参观,小红书上面已经写的很详尽了,我实在是不愿意报菜名,还是谈谈这次在日本旅游的见闻和感受吧。
在这次金泽之旅之前,我的两次日本之行分别是 4 天(考虑到飞机的时间其实是 3 天半)的大阪之旅和 2 天(考虑到飞机其实是 1 天半)的堺市之旅。
这次我给金泽整整分配了满打满算的 5 天(考虑到新干线,并且中间去了一次富山,是 4 天),可以说是非常奢侈了。一些比较熟悉日本的朋友知道我准备在金泽整整玩 4 天之后,感到非常震惊,居然要在金泽玩 4 天,到底要怎么玩?但实际上我觉得这 4 天充实极了,甚至时间有点不够用。
4 天时间,我游玩了所有的知名景点,比如 21 世纪美术馆、东茶屋街和兼六园,更去了非常多不那么出名、甚至是“非常规”的景点,比如犀川绿地公园、金泽大学、野野市市役所附近的农田,黑门前绿地等。
如果需要在心里打个分的话,我认为所有非常规景点的质量都远高于常规景点,不论是当时的心境还是离开之后翻看照片的感受,都是如此。
为什么会这个样子,就我目前的观察样本来看,包括大阪、堺市和金泽在内,整个日本都被一种特有的磁带未来主义美学包裹起来,并且在这个方向上优化到了无可优化,甚至过拟合的地步。这种过拟合的美是所谓的人造景点无法比拟的,因为景点还需要维持一些古典的样子,但街景就是日本最真实的写照,这就是为什么我始终认为日本的街景要比景点更好看的缘故。
下面这段关于日式现代美学的描述完全是我胡诌的,没有查阅任何资料,基本上就是直观感受。
这种美学特性包含了 3 个特征:磁带未来主义、过度优化、衰落感。
什么叫磁带未来主义美学?简单的说,这是一种“复杂之美”。我借着在金泽坐公交车的经历尝试解释一下这种美的具体表现。
在中国的绝大部分城市,如果要坐公交车,通常就是给 1 元,就可以从头坐到尾、如果实在是很远可能需要给 2 元,但是一般来说不会每个站都设置一个价格,这里面自然有补贴的原因,但也有运营成本的考量。
金泽的公交车,每一站价格都会变动,同时考虑到不同的乘客会从不同的地方上车,假如一条线路有 n 个公交站,那么在金泽,这辆公交车的票价组合最大可能是 n*(n-1)/2 这个数量级。
乘客要怎么才能搞清楚这么复杂的计价条件呢?答案是纸片。
金泽的公交车是统一从后门上车,前门下车的,上车之后可以拿到一个纸片,上面有数字。
这个时候公交车前排就会显示到下一站的时候,不同数字的乘客需要缴纳的费用,过一个站点,所有数字对应的要缴纳的费用都会刷新一下。
如果有 IC 卡自然也可以选择刷 IC 卡,但是金泽的公交系统好像是刷不了西瓜卡的。没有硬币?没关系,日本的公交车虽然不收纸币,但是上面会配备了可以塞纸币然后吐等额硬币的换钱机器,再把机器吐出来的硬币给到司机即可。
之所以要这么脱裤子放屁一圈,主要还是因为算价系统过于复杂,机器没办法识别当前乘客的具体价格,所以只能选择压根不收纸币。
我这么讲好像看上去很简单的样子,其实仔细一想就会发现整套系统还挺复杂的,尤其是那个最大可能需要 n*(n-1)/2 数量级的价格组合。
但是仔细想一下,会发现这套系统非常“美丽”。毕竟这套公交计价体系是从上个世纪 70、80 年代开始运转的,当时可没有二维码和智能手机。
日本人在有限的科技条件下实现了一套复杂的计价系统,这件事情就是非常朋克的,如果不借助现代的数字化设备,这就是最优解。而别的国家的人很可能会直接放弃这么复杂的计价体系,直到基础可学发展到可以支持为止。
纸片、屏幕计价,这一切都很容易让人联想到最古老的计算机:打孔机。
日本失落了 40 年,他们整体的技术基础从 40 年前就没有迭代过,换而言之,整个现代日本的构成就是基于上个世纪 80 年代技术的,在此基础上不断地雕花,不断地精进,通过复杂的系统设计,不惜以增加使用成本为代价,来榨干所有基础技术的极限。日本这个国家某种角度来说就和三体里面被智子锁死了科技的地球很像。
除了交通系统,最典型的代表莫过于日本的功能手机产业,一个典型的「加拉帕戈斯化」产物。
如上图所示,在 1999 年日本人就曾经在黑白功能机上面做了机票预订的服务,我看着上面这个黑白的小屏幕陷入了沉思。怎么说呢?日本的工程师和用户真的牛逼,一个敢做一个还真 TM 敢用。
说这些不是想表达日本这么做是对的,相反在我看来这完全是不得已而为之,因为他们没有足够的年轻人去完成技术迭代升级,只有老人在上班,而老人只能掌握老技术。再加上年功序列和终身雇佣制这两种制度加成,日本老人的话语权远大于年轻人。所以整个社会就只能在一套特别老的技术上不断迭代。
上面说的这一切,造就了现代日本美学的第一个特性:磁带未来主义——一种基于上个世纪70、80年代的技术基础展开、以磁带、打孔卡片、塑料、电气和低采样音视频(8bit 乃至 6bit)为特征,一种基于低技术实现复杂能力的系统设计美学。
日本还有一种音视频流派叫做蒸汽波,和磁带未来主义有异曲同工之妙,感兴趣的朋友也可以自行了解一下。
基于磁带未来主义自然而然就有了日式美学的第二个特征——过度优化。
由于各种各样的客观或者主观的原因,日本产业升级的道路很早以前就断掉了,这导致他们的产业升级要么是被动的(比如智能机进入日本市场),要么干脆就放弃治疗了(比如新能源)。
随着人口越来越少,日本人的心态也开始小国寡民起来,反正不用做产业升级,就有大量的时间可以拿来雕花,什么事情都可以做的尽善尽美,虽然没钱产业升级,但是有钱屎上雕花。
这点在日本的电线杆上体现的淋漓尽致,熟悉日式摄影的人可能都知道,电线杆是日本风景摄影的一个常见题材,电线杆上的电线特别多,但是他们会尽可能把电线杆上的线弄的整齐一些,反倒成了一种风景。比如下面图中右侧的电线杆就是典范,家里有老电工的可以请他们来看看,这个电线绕的其实很讲究。
电线杆子整这么精细,有什么意义吗?对中国来说当然没意义,中国基建迭代速度这么快,今年是电线杆,明年可能就走地下了,搞这么精细完全是浪费时间。
但是日本这么玩电线杆是真的有用啊,毕竟他们已经原地踏步 40 年了,可能连立新电线杆的钱都不够了,可不得好好绕电线么,都乱成一团真就没电用了。
当然这种过度优化也会造成一个效果,可能全日本在硬件上面都会趋同,因为他们很容易在特定的技术条件下找到最优解,然后全日本都变成一个样子了,至少气候接近的地区是一样的,而整个本州岛的气候都是很接近的。
京都有鸭川,金泽有犀川,富山有樱桥,每个城市的市役所都有展望台,效果几乎都一致。
金泽大学长长的坂道上盛开的樱花,和我在动画片里看到的任何一所高校别无二致。
这种过度优化也会拓展到艺术、饮食和店铺领域。在金泽有不少店家是推门进,几乎每家店都挺精致的,放国内都可以算得上是网红店了。
当然要说过度优化的极致,莫过于日本的厕所,日本的厕所是一个让我觉得非常神奇的存在。
在日本的公厕,除了关西机场临空公园的机场稍微有点味道之外,所有的厕所都非常干净,这个非常干净是指没有任何痕迹,并且没有任何异味。比字节跳动工区的厕所还干净,要知道字节跳动工区的卫生间万年有人守着打扫的。
这个厕所干净到我觉得这个甚至不能用国民素质来解释,难不成日本是有厕所警察吗?还是说除了外国人之外没有人会上公共厕所?我不得而知。
日式美学的第三个特征就是衰落感。
衰落感这个事情,我曾经把它简单的归结于“少子化”。
但是在这次金泽之行中,和当地人有了更多的短促的沟通,我认为日本特有的带有衰落感的美学,是一种“从一开始就会考虑如何结束”的思维模式促成的。
传统日式美学中有一个概念叫做:侘寂。
这种美学特性强调世间没有什么是能够长存的,在日本的美学中,衰败的事物会比盛开的事务更容易唤起这种概念,他们会试图在所有的设计中暗示事物的短暂性。
所以樱花这种花期很短但是盛开的时候特别热烈的植物会成为日本的国花,而在人际交往中衍生出了一期一会这样的概念。
既然一切事物是短暂的,那就让我们尽可能把握住机会处理好每一个细节,所以日本虽然整体给人感觉是衰落的,但又非常体面,比如下图,尽管街道已经老化到需要修缮的程度,但是还是会额外先把临时的橡胶盲道铺设好。
那么日式美学的代价是什么呢?
在金泽的松月寺附近,我看见一家三口在打扫室外的柏油路面停车场,用吸尘器吸,停车场的地皮应该是私人的,附属于寺院,这一家三口就是寺院主人。男主人打扫的时候还和女儿吵架了。
在京都我看见一个阿婆就清扫自家门口路面角落,用水冲洗,然后用扫帚扫。
日本有大量的土地私有,土地私有的同时意味着环卫工作也要私有,相当于层层分包了。最终这些工作大部分会被日本妇女承担,她们不但是家中的隐形劳动者,也承担了这个国家看不见的工作量。
漂亮干净的街道背后有不少人默默付出。
在富山,我看见上班族们集体下班吃饭,所有人都是西装领带,可能偶尔有人穿大衣,那90%的概率也都是卡其色的大衣。
该说不说,日本几乎所有人穿西装背双肩包上班的样子,真的很像一场大型的社会级 SM。
再说说一期一会的概念,日本人对陌生关系处理的非常好,以至于我很怀疑大部分日本人压根不会处理亲密关系。给陌生人越多的能量,意味着给亲密的人越少的耐心。
当然这个代价不仅仅是在日本上班生活的人承担,作为游客我也会被溢出击中。
从大阪前往金泽的新干线上,我然后喜提一次地震,列车直接停下来检查了 40 分钟。因为买的是换乘车票,照理来说是铁定赶不上了。
下车之后发现每个车门口都安排了一个工作人员搁那鞠躬,我大喜,赶紧问工作人员这种情况下换乘应该怎么办。负责鞠躬的工作人员表示:这不是他的工作,并且很不高兴。一副“我都鞠躬了你还想怎么样”的表情。
所以日本的这种美学,是建立在一个特别奇怪的社会基础之上的。
从社会发展层面来说这是很蠢的,它为了实现低技术条件下的复杂系统,给在这个系统里面的每个人都施加了一些压力。但我是游客,我不就是来看这个的吗?
如果我想去一个到处都是智能化,自动化的地方,我为什么要来日本呢?反正我又不在日本上班,日本职场傻逼和我也没关系。
所谓爱一个人就带 TA 去日本旅游,恨一个人就带 TA 去日本生活,大概就是这个意思。
总而言之,包括金泽在内的日本大部分城市,是我除了苏州和青岛以外闲逛也不会觉得厌烦的地方,只要我不在这边上班就行。
聊完了上面关于日本美学的话题,关于金泽还有几个话题想聊。
关西人的宗教生活。首先我可以 100% 确定日本社会一定是一个彻彻底底的世俗社会。但是宗教是负责装扮他们生活增加仪式感的重要部分。
他们会把和“生”有关的命题交给神社,比如新年,比如小孩子长大了,都会去神社参拜,总之一切积极向上的,美好的东西都会寄托给神社。我自己替好朋友求了一个母子平安的御守,因为当时他老婆快生了。
但是在面对死亡时,大部分人会选择佛教,所以日本的寺庙都很小,大多散布在居民区里面,并且每个寺庙都会有一个院子,院子里面全是墓碑。关于日本的寺庙,有一部漫画叫做《猫之寺的知恩姐》,很写实很好看,推荐给大家。当然如果是那些作为景点的寺庙不在讨论范围内,我这里说的寺庙特指在居民区内的寺庙。
接着再聊一下在日本打车这件事。国内很多人会把在日本打车的价格妖魔化,在金泽旅行之前,我也会认定在日本打车是一件不可接受的事情。实际上打车的金额来看,如果是 10km 左右,两个人的话一个人需要出 100 元人民币。如果有一个地方恰好很难通过公交达到但是又非常想去,同时是多人出游的话,打车是完全可以接受的。
在这次旅行我还学会了一招,买火车票的时候我经常会留一些 Buffer,导致进站之后只能干等着,其实如果买的是特急或者新干线,指定坐席的那种,也是可以直接上前序序列的火车的,因为火车上会有一个车厢是不指定坐席的,专门给这种情况设计的。
我上面所有的观察样本都是非常有限的,在写这篇游记的时候我也没有去查阅过多的资料,很可能上面的说法都是片面的,错误的。
正是因为这些局限性,让我越发希望可以去日本的每个地区都看看,多观察观察不同地区的区别,做一些当地人才会做的事情,这样我对他们的美学,他们的日常,他们的宗教,他们的喜怒哀乐可能会有更深入的了解。
在金泽的旅行让我觉得自己的旅行运气很不错,至少我每次去日本的旅行运都不错,不但看到了盛开的樱花,还在金泽大学和有趣的人交谈,甚至还碰上了他们的春日祭典。
对于旅行者来说要遇到这些并不容易,对于旅行中的运气,我一直有一个很迷信的的想法。除了做足够详细的计划之外,我觉得对旅行目的地纯粹的心意也是很重要的。
所谓旅行者的诚心,大概就对一个陌生地方细致入微的观察以及放下一切戒心的喜爱吧。
如果足够诚心的话,这个地方一定会展示出自己最好的一面,我是这么坚信的,至少在大阪、堺市和金泽的经历都验证了这个迷信的想法。
关于金泽其实还有很多想要说的,比如做了一个特别详细的旅游计划,然后完全打破它,比如在这次旅行吃了 4 顿人均超过 1000 RMB 的料理,又比如在最后一天感到体力不支等等,但是写到这篇幅已经太长了,就此打住吧。
最后的最后,我想展示一下金泽城的夜樱,在此之前我从来没想过可以用满天繁星一般来形容樱花。看的时候可以听着宇多田光的《Fisrt Love》。
You are always gonna be my love.
这篇游记就是我写给金泽的情书。
朔州之行是一个蓄谋已久的临时起意。
原本朋友说的去大同,我便问了一嘴哪个景点一定会想去看,TA 回答:“应县木塔。”
想去应县木塔很久了,一直苦于没有机会,正好得知能够搭朋友的便车看应县木塔,于是我就厚着脸皮申请:“带我一个,谢谢。”
于是我就顺理成章地成为了他们后排位置上的那个闲散人士(车子后排上那条会按快门的狗),为了报答收留之恩,我便开始做旅游攻略,做攻略的时候发现其实应县木塔是朔州而非大同的一部分,于是顺理成章的切换了城市。
朔州之行的整个行程变敲定下来,应县木塔 → 朔州古城 → 利民堡。
先说说应县木塔,由于应县木塔实在是太有名了,去之前我对它有不少的想象,实际到了之后,我反而觉得没有那么震撼。很多人说看见应县木塔的时候会觉得这东西像一座山,至少我自己完全没有那个感觉,不知道是不是因为当天在下雨的缘故。
应县木塔我在太多的短视频、长视频里面都看见过了,所以这一次去木塔,会给我一种圣地巡礼的感觉,B站上有一档节目叫《有意思吗》,里面有一期 vlog 内容是一行人开车卡在了应县木塔下的马路牙子上,我还特意去看了一眼那个马路牙子。
到了这种网红景点,盖章自然是不可少的,应县木塔的盖章可以说是非常成熟了。只要花钱就有人可以帮你把接近 60 个章都盖好。
你自己不需要动手,也不用纠结会不会盖歪,更不用纠结一堆人排队盖章,而且是一条龙服务,不需要到各个地点去收集盖章。坏处就是你失去了”收集“的乐趣,也失去了”自己手作“的乐趣,这个行为彻底商业化了。
我在看着小哥效率极高的帮我盖章的时候,我突然产生一个问题:”我们他妈的在干嘛呢?“
这种花钱让人盖章,并且一次性盖 60 个章的行为,让我很容易联想到一个关于 GDP 的冷笑话。
两个经济学的学生走在路上,然后看到路边上有一坨屎,A 对 B 说:你把这坨屎吃了,我就给你 5000 万。那个 B 为了钱毫不犹豫的吃了一坨屎,A 也爽快的掏出了 5000 万的支票给 B。他们继续走着,但是心里都有了一个疙瘩。
A 心想他吃了一坨屎,我就给他了 5000 万,真不值。B 心里想,我吃了一坨屎,才拿到 5000 万,真不值。突然在路边,又出现了一坨屎。于是 B 要报复 A 说道:你把这坨屎吃了,我就还你 5000 万。A 看到有这么一个机会可能弥补损失,于是也毫不犹豫的吃了。但是两个人回过头来想想又觉得不对,两个人什么都没得到,却一人吃了一坨屎。于是他们把这个笑话告诉了他们的经济学导师,导师激动的喊道:天哪你们刚才知道做了什么嘛,你们就在刚才创造了一个亿的 GDP 啊!
抱着对盖章的疑问,特意搜了一下这种旅行盖章的起源,目前我能搜到的起源有两个。
一个是日本的御朱印,御朱印简单的说就是在参拜神社或者寺庙之后可以拿到的神官或者僧侣手写的符,作为你参拜了这个寺庙的证明,这个东西最初可以追溯到平安时代(从794年迁都平安京(今京都)开始,到1185 年结束),然后慢慢的扩散成了旅行盖章打卡。
另一个是保加利亚在 1966 年的由官方举办的 100 Tourist Sites of Bulgaria,这个活动允许人们拿着专门的小册子去集邮盖章,活动的主要目的是为了保护保加利亚的旅游遗产。保加利亚的这个活动显然和现代旅游中人们的盖章活动更接近一些。
盖章这玩意最初设计的时候,趣味点主要是在于收集,我要亲自到某个地方去,并且亲自盖章,这样能获得满满的成就感。对于官方来说,可以通过盖章的方式带动一些不那么热门的景点,博物馆则可以通过盖章的方式引导小朋友们尽可能完整地参观整个展览。
应县这种商业化到极致的盖章,怎么说呢?我只能说,这几个章挺好看的,然后就没有然后了。但是坦率来说一个木塔卷出来 60 个章,让我自己盖我也是懒得盖的,有的时候真的很想问候搞文旅产业的这帮家伙:卷你妈呢?
从应县木塔离开,驱车一段时间就来到了朔州市,朔州市的古城没有像大同那样新修了城墙,只保留了一些夯土结构,并且并非连续的,有点像北京的北土城公园。
朔州市的景点挺不错的,但是正如我一贯写游记的风格,不写景点,写写在朔州看到的人间烟火气。
按照我一贯的观点,烟火气这个事情其实向来和脏乱差是脱离不开关系的,不过朔州的烟火气还是超出了我的想象。
我在街边看到了一家店,上面写着”现杀鲜牛“,然后我在店门口看见了刚刚剥下来的牛皮,以及一颗血淋淋的牛头,简单的说就是一眼就过不了文明城市的那种存在。至于大街上的烧烤摊、卖水果的,那更是多的不得了。
在朔州古城的城墙公园附近逛游的时候我发现这的人真的很爱打牌,七八个人聚集在一起,就打扑克,甚至看不到下棋的,整个公园全是打牌的人。
还有一个比较超出预期的事情,朔州的天主教堂和基督教堂数量是真不少。朔州古城面积估计也就一平方公里出头,但是居然有 4 个基督教堂,一个天主教堂。
这几个教堂我恰好都路过参观了一下,有的教堂甚至就是个预制板房,挺有意思的。
晚上为了给朋友的电动爹充电,去了当地的万达吃晚饭,在当地万达我看到了很多疑似是连锁的,但是从来没有见过的餐饮牌子。目前观察下来能够横跨123456线城市的零售店铺,我脑海里面就只有一个,那就是蜜雪冰城。蜜雪冰城是真的牛逼啊。
虽然说崇福寺、应县木塔都很让人欣喜,但是要说最近好看的还得是前往利民堡路上时的自然风景。五月份的中国北方是很美丽的,南方的树大部分都是常青树,所以叶子颜色会很深,而北方大多是绿也是,5月份的时候叶子基本长齐了,但是颜色还很嫩,配合风力发电机,真的是别样的风景。
其实这次朔州之行,我一直有一丝隐隐的愧疚,因为我建议把目的地从大同切成了朔州市区。尽管从景点来说,朔州的崇福寺也是非常经典的古建筑,朔州本身很值得一去,同时朔州和应县确实属于同一个地级市。
但是再多的理由也掩盖不了一件事情——我并没有在一开始就很坦诚地说清楚我不想去大同的主要原因是我去过一次。所以做人还是要心思少一点,想要什么就直接说,不然自己真的会记很久,如果朋友恰好看到这篇游记的话,就请接受我诚挚的道歉吧。
真的是万分抱歉了!
如果没看到,我也不会专门去说的,毕竟隔了这么久突然冷不丁说这个事情,还挺诡异的。
这次围绕呼伦贝尔地区的自驾游是我人生中第一次,由我负责开(一段)车的自驾游。其实在此之前我曾经和另一个朋友自驾去茶卡盐湖拍摄星空,本来说要让我开一段的,一上车我就把油门当刹车踩了,朋友实在是遭不住就没让我开。
感谢这次和我一起出游的朋友如此信任我的车技。这次旅行出发之前,我的目标不是要吃到什么,玩到什么,而是确保两个人都全须全尾活着回北京,并且不需要坐牢或者吃官司。
坦率来讲如果这次旅行是我自己一个人出游的话,体验应该会很差, 因为我做了两件特别傻的事情。
第一个事情就是旅行计划没做全,在我的计划中有一段是从阿尔山出发到满洲里,中间从呼伦湖绕过去,看一下呼伦湖的景点,这个行程距离大概超过了 500 km,是一天之内很难达成的目标,尤其考虑到我还是一个新手司机。
然而在我的旅行计划里面,那一块是这么写的:
感情我计划压根就没做全,直接就是一个想当然。当然计划做成这个鬼样子,和国内地图软件也有关系。
这还真不是我甩锅,国内的地图软件网页版基本上就跟不维护似的,和 Google 地图体验差了不止一个数量级,问题是Google 地图对国内又几乎完全没有任何的数据更新计划,结果就导致做计划的操作成本特别高。
写计划是用的电脑,但是很多截图必须要上手机端,网页端功能都是不全的。而在此之前我做旅行计划几乎都是国外游,国内游我就没怎么过做计划,直接导致踩坑不断。我知道上面这段话可能显得我特别外宾,但我还是想说,傻逼的是国内地图软件,不是我。
不过谢谢朋友的帮助,这次旅游的体验非常好,虽然我拉胯了,但是有人带我超神。
从阿尔山开到柴湖风景区,主要是为了看阿卡公路路上的风景,到了柴湖风景区朋友告诉我 TA 觉得我的计划做的有问题,所以我们临时决定当天从柴湖开到呼伦贝尔夜宿,第二天去呼伦湖看风景,这样时间会宽裕一些,唯一的问题是需要走夜路,这个重任自然就交给了老司机,我就只能坐副驾驶了。
在大概晚上 10点左右的时候,我看见 TA 在开国道速度到了140 km/h,本来想提醒一句,但是一想这锅不是我的吗?就没敢开口。于是 TA 就开夜路把我俩带到了呼伦贝尔。
当然朋友超神的点还不止这一处,比如在黑山头骑马的时候,我的斜挎包不适合骑马时背,在朋友的帮助下和马场老板沟通愣是问他们借了一个双肩包,这样我才能带上我的相机拍下黑山头上的落日。又比如在柴河镇找不到卫生间(其实是找不到足够干净的卫生间)后,TA 机智地提议建议去附近的政府单位里面解手。
怎么说呢,就是一个充满了街头智慧的人,随机应变的能力很强,很冷静也很强大,这种人我是非常佩服并且非常希望学习的。旅行第一个非常重要的作用就是用最直观的方式让旅行者明白这个世界上有很多东西和自己的日常是完全不一样的, 并且旅行的环境会迫使旅行者去接受这件事情,不然可能吃喝拉撒都成问题。这个非常锻炼人的街头智慧,一个只能在特定环境和特定规则下生活的人,比如习惯了大都市的人,和一个在任何环境下都能想办法生活下去,能解决自己实际问题的人,显然是后者更有魅力。
我做的第二个傻事,发生在呼伦湖,呼伦湖有个景点叫做成吉思汗拴马桩,很适合用无人机拍摄,所以我这次特意问我的好哥哥借了一台无人机。
在借给我无人机之前,他语重心长的嘱咐我:“记得看说明书,别炸机,炸机要赔钱!”
我:“你放心,我玩精密仪器有一套的!”
然后到了呼伦湖,遥控器和手机连半天不上,想打电话问借给我无人机的兄弟这个东西怎么用,但是那边没有信号。事后证明是我不但不看说明书,还不看界面上的提示文案,导致连接不上。
在从呼伦湖回到满洲里的路上看见了彩虹以及绝美的夕阳,这个夕阳好看到什么程度呢?停下来拍照,然后继续开,开到一半又停下来拍照,我说这保证是最后一次。结果没开多久,我就开不下去了,于是就在车上再看了一会夕阳才走。
我在想这个夕阳莫不是上天给我的补偿,因为我太傻了,老天爷实在是看不下去了,给点给点。
不过这些骚操作耽误了一些时间,导致当天应该是 8 点多还是 9 点多才吃上饭,不过朋友没有任何怨言,非常感激。
这趟旅行中我也碰巧获得了一些独处的时间。在满洲里的时候,朋友早上要赶公司的活(好惨一个人),我可以有时间独处一段时间,本来想开到套娃广场去看看,但是离套娃广场越来越近的时候,我突然开始产生一些逆反心理。
一路向西开去,导航一直在提醒我:“你已经偏航了!”一瞬间恍惚了,我觉得导航好像说的不是我开车开偏航了,而是我的人生偏航了。去你妈的,我直接越过目的地一路往前开。
到了国门风景区,再开下去就出国了,停了下来。如果不是一个人的话,我应该是不敢做这其中事情的,毕竟看着很像是一个情绪不稳定的疯子,毕竟我也还是活在社会的规训之中。
要说这场旅行最让我印象深刻的是什么,那就是气味。从满洲里前往黑山头,走的是知名的边境公路 331 国道,这条公路说是很好看,但从我自己的主观感受来说不如阿卡公路的风景好。这条路开的我都有点困了,这个时候我听到咔嚓一声,原来是副驾驶把啤酒打开了,过了没多久我又听见了开薯片袋子的声音。
于是这一路就有了啤酒味和薯片的香味,车上放的是周杰伦的《雨下一整晚》,这一刻,我觉得有点语文课本里面所说的“通感”在里面了。
在满洲里的时候外带了两个肯德基的原味鸡腿堡,以及两罐啤酒,这些带到了黑山头的观景台上面,就这样在黑山头看着落日一点一点下落,我有一瞬间觉得自己好像在富达大厦的楼顶,和爸妈一起看着太阳滑向狮子山,又觉得自己好像在青岛信号山上感受迎面的海风,这是我去了 3 次的地方。
只不过在当下这个场景,我收获的是肯德基限定版原味鸡腿堡味道的海风(还有一些马粪的味道)。
我本以为黑山头的落日就是这次旅行最精彩的部分了,但恰恰没想到最精彩的部分竟然是人工制造的。
在黑山头住的那天晚上,吃完宵夜准备去看看星星,路边正好看见了一个烟花店。
朋友:“你想不想看烟花?”
我:“你是天才吗?”
这件事真的很让我佩服,因为我是那种看见了烟花店也想不到自己可以买烟花放的人。
两个烟花,开十几公里,找到一个没什么人的地方,在大草原上把烟花给放了。作为高素质人类的典范,自然是要做到不留痕迹的,于是就把放完烟花的残余放到了汽车的后备箱,在返回旅店的路上,车内有一股淡淡的硫磺味。
虽然本来是想去看星星的,但发现好像自己制造的星星,要更璀璨一些。我想从今天起每次听 《君の知らない物語》时都会想起今天的烟花,以及车厢内的硫磺味。
这段旅行中,有一段对话我觉得还挺有意思的。我被 TA 问到了一个问题。那就是拍照会不会形成对观赏风景的一种戕害——如果花费了大量时间用镜头看风景,那么回想起旅行的时候,会不会就只记得拍摄的过程,忽略了感受本身。
其实这个问题我当时脑子里面就闪过了好几个不同思路的回答,比如相机的光学构造决定了它是人眼的延伸,比如色彩科学意味着这个世界上本就没有所谓的真实的景色,比如萨考夫斯基关于摄影的 5 个基本要素的阐述等等等等。
这些答案都很有道理,但是我觉得如果用很复杂的理论去回答朋友的问题,本身就是一种逃避,复杂的理论是逃避阐述自身想法的保护色。
但我最后回答的是:会影响,但值得。(原话我不记得了,但是我应该表达的是这个意思)
拍照是一种形式活动,如果一个人的感性是十分敏感的,这种形式活动自然会形成一种干扰。但是这个世界上没有人在每时每刻都能保持十足的敏感性,所以形式可以很大程度上去保证感知的稳定。
简单的说,如果我带了相机,相机可能会影响我欣赏落日,但是如果我不带相机,可能连欣赏落日的初始动作都不会发生,并且照片是可以分享给别人的。比较折中的做法,是带一个三脚架拍延时,而我就需要坐在那看就可以了。
但假如某个时刻特别特别精彩或者让我沉浸呢?
如果某一个时刻我特别喜欢,我是不会按快门的,因为不希望它打扰到我。
总的来说第一次自驾我还是学到了不少东西的,无论是开车技巧还是如何更好的在旅行中“容错”。
作为副驾驶,不到万不得已千万不要睡觉,这是我在这次自驾中学到的最重要的一课。尤其是在中国北方开车,景色异常单调,非常容易犯困,我经常需要用掐自己肉的手段来维持清醒,不是没睡好,是单纯的很容易犯困。此外自驾的话一路上会有大量的时间可以交谈,所以提前准备好歌单、话题、笑话非常有助于身心健康,不然可能会聊到一些很奇怪的话题,聊着聊着聊劈叉了很麻烦。
自驾的话一定会非常希望自己能有一个运动相机 or Pocket 可以作为行程记录的一部分,毕竟有的时候路上的风景真的很不错。如果还要自驾的话我可能就会考虑入手相关设备了。
哦对了,租车还车的时候不加满油的话,不仅仅需要补油钱,还有额外的跑腿费需要补,所以最好还车之前加满油,如果不是时间特别紧张的话。
这次行程坚定了我一直以来的一个观点,一个地方的餐饮水平基本上和当地经济水平呈正相关,和离原产地近不近这些,不能说没有关系,但是关系真的很小。整个行程中我吃到的最好吃的饭菜就是满洲里的俄餐,而满洲里显然是这几个城市里面最有钱的那一个,整个城市都跟新的一样,相比之下呼伦贝尔的市中心竟然还有叙利亚战损风格的大楼。至于黑山头以及阿尔山景区附近的餐厅,我只能说真的是一言难尽。
最后说一个很离谱的旅游收获,我自从加入现在的公司没几个月就开始失眠,失眠原因一直不得而知。这次出来旅行,买不到三得利乌龙茶,加上同行的人提醒,我没有在睡前喝浓茶, 失眠好了。这时我才意识到,在公司的时候我会习惯性上班一瓶三得利乌龙茶,下班再提溜一瓶回家,毕竟公司补贴之后三得利乌龙茶才 8 毛一瓶,我 TM 当水喝。
从呼伦贝尔飞回北京,飞机晚点只能选择打车回,因为我的住所会更偏一些,先送 TA 到楼下。
临分别之际,我说了一句谢谢。
我在感谢什么呢?我也不知道,可能是车技的指导?旅行的邀请?还是对我种种愚蠢行为的包容?可能都有吧。
“明天见。”
「明天见。」
在抖音刷到了狐主任的视频,说是保定的古动物博物馆弄的特别好,可以看到很多恐龙骨架。仔细一看,这不是中国科学院古脊椎动物与古人类研究所的成果么,这可是国内研究恐龙的 TOP 1。
哪怕为了这个博物馆,保定我得去一趟,但是为什么要选择在 2 季度末尾去保定,其实原因非常诡异。
在写这篇游记的时候,一开始选择把内蒙之行放在最后,但是突然觉得这样写,这篇游记在美感上面是不足的,我需要一个有点无聊的地方来收个尾,于是就选择了保定。
简单的说,我要为了游记这碟醋去包个饺子。
而保定,非常稳定的让我失望了,作为一个游记的结尾真的很好,因为写到这个时候,其实我已经有点烦了。
古动物馆的展品质量可以说是中国北方一流,这个就是中国北方最好的古动物博物馆,北京的古动物馆和自然博物馆都无法与之相媲美。
看完博物馆去保定市里面逛了逛,他们当地最好的寺庙太慈阁正在修缮,不过边上的小门是开着的,我就特别厚脸皮的走了进去,看见里面有一个尼姑。
我:“你好,我想拍点照片。”
见尼姑没有回应,我说了一句:“求求了!”
“你拍吧,不过里面在修,很危险,不要进去。”
于是我就拍下了几张太慈阁的工地照,也算是独一份的了。
逛完太慈阁,离吃饭还有点时间,我去保定本地的保百购物广场看了一眼。
保百,就是保定百货的简称,在德州的时候我也看到过德百广场,应该都是计划经济时代的百货广场遗留下来的产物,现在该组成了公有制企业。
保百购物广场的一楼和二楼是超市,收银台在一楼,三楼是类似于万达的那种购物中心,同时还有四楼和五楼。这栋楼很有意思,它的电梯是那种可以把超市手推车推上去的电扶梯。其实我还挺奇怪的,收银台明明在一楼,为什么这电梯要一路修到顶楼去呢?是为了方便超市购买完东西的人上楼吃饭吗?但是如果是这样的话,为什么北京那些在底楼有大型商超的购物广场不这么设计呢?
怀着这样的疑问,我来到了它的顶楼,发现四楼和五楼是停车场。
其实一开始发现这个现象的时候,我还挺激动的,觉得自己好像发现了些什么新奇玩意,但是当我看见停车场的一瞬间就明白了,这其实是一个非常常规的设计,小时候在苏州逛的超市也是类似的设计。
这个经历其实本身没什么意思,但是促使我开始思考一件事情,就是所谓的旅行获得的见闻是不是有效见闻。
旅行的意义可能不是找到答案,因为短短的几天是很难找到答案的,但我认为旅行可以找到比较好的问题,因为人在身处那个环境的时候,可以发现一些平常发现不了的问题。
比如我现在就很好奇,类似于保定百货,德州百货这样的老百货公司,在全国还剩下多少家,他们生活的怎么样?
此外得益于现在互联网 O2O 事业的发展,我在抖音、大众点评、滴滴、饿了么和美团只要把地点切换到当地的位置,就可以一下子对当地的物价、消费倾向和主要娱乐方式有一个非常粗浅的理解,但是因为信息是高度集中的,这某种角度来讲也算是一种“赛博穿越”了。
这个思路也是我在保定打车的时候突然想到的, 因为我发现一个地方的特惠快车的价格,基本上可以是作为当地物价的一个锚点。当然也受到了评论尸《少读点书,多刷刷抖音吧》的启发。
用滴滴快车的价格衡量当地物价水平的思路后面可能可以用在《明日故乡》的迭代上面,但是具体能做到什么程度,还得看 API 的情况。而且也不是我写代码,我只是提需求而已。
所以旅行能增长知识吗?
如果从功利的,增长知识的角度来说,旅行几乎是没有用的,但是从发现一些奇怪细小问题的角度来说,旅行是一个特别不错的手段,而寻找答案,互联网是最好的工具。
这些通过旅行发现的问题,解决之后有没有什么作用呢?我觉得功利的来说,也是没有的,我就算知道了国内有多少老百货公司又怎么样呢?
其实不怎么样,但是解决这个问题的过程是开心的,而且解决这个问题需要比较好的搜索技巧,在这个过程中还会有别的发现,至于所有的这一切,可能是没用的,可能是有用的,但是重要的是开心就好。
至于有用没用,GPU 最早发明出来的目的是为了让宅男们可以看见更好看的枪车球,现在全世界人都应该感谢游戏宅,没有他们的付出就没有今天 AI 领域的基础成就。
不要在意一件事情有没有价值,要在意它有没有趣,这不仅仅是一种态度,也是一种策略。
如果我的保定之行就停留在这一天,直接在晚上打道回府的话,那是相当开心的一天。然而第二天我逛了逛保定市内的景点。直隶总督署,莲花池这些,怎么说呢?直隶总督署就是一个超级弱化版的恭王府,而莲花池作为园林也是相当的,嗯,不知道怎么形容。
在城里面瞎逛游的时候我发现保定这个地方虽然没什么景点,但是市容市貌弄的是真不错。除了马路上会有垃圾站,味道很冲,剩下的大部分地方都挺干净的。路边偶尔还会看见一些街头涂鸦,增加了不少趣味。和出租车司机聊天得知,保定在前几年搞文明城市建设的时候,就一直保持了比较好的市容市貌,并且延续到了今天。
因为太过无聊,我取消了下午去东湖公园的计划。
最后还是说说为了游记特意制定了一个行程这个事情吧,可能在很多人看来,这种为了形式填充内容的行为是本末倒置的,但是根据媒介即信息的理论,我们所有人终其一生都收困于媒介,形式的力量就是非常强大的。
如果我无法脱困于形式的力量,我希望至少可以选择自己回顾自己过往的方式。
能够自己决定怎样回忆自己的过往,其实是一件非常厉害的事。
2024 年 Q2,我有 3 个周末是在苏州渡过的。
自从 2023 年开始,每次从苏州回北京,只要是坐高铁回,我都会在苏州北站店点一杯茉沏的奶茶。
茉沏这家店的奶茶,其实我不太爱喝,但是每次都会点,仿佛已经成了习惯。
要问为什么?我想有两个理由,第一个是茉沏的看板娘实在是太可爱了,虽然不好喝,但是因为看板娘很可爱所以会买,我们二次元是这样的。
第二个理由,就是在快要离开苏州的时候,喝一杯在北京找不着,但在苏州才比较容易找到的奶茶,会比较符合我当时的心境。
一杯不太好喝但是我一定会点的奶茶,就好像游子与父母,大都会与故乡。
以及恋爱与婚姻。
写完这篇游记,我对自己做了两个我觉得还挺有意思的统计。
一个是对游记本身做了个统计。这篇游记,有超过三分之一的篇幅在讲述金泽的见闻。
大概时间花在哪里,爱就在哪里。金泽篇章的游记把我的感性都耗尽了,以至于写其他目的地的时候好像抱怨居多,其实这几趟旅程我都挺满意的。
而且在写之前的时候,其实我会以为内蒙自驾的旅行是感触会比较多的,但实际上提笔的时候却发现非常难写,可能内蒙有很多的感触都是过于向内的,以至于没有办法用文字很好地表达出来。
也还有一种可能性,只要是独处的时间比较长的旅程,游记的内容就会变多,比如保定,朔州(因为我是后排的狗,可以有时间思考很多问题),反过来说像天津,内蒙的行程,因为独处的时间很短,整个旅程很快乐甚至疯批的,自然就不会想这想那想那么多,而金泽的旅程中,有两天时间是和人一起的,剩下时间都是独处,所以会一路上也会思考很多。
所以在金泽的游记里面写了大量的抽象的概念,而内蒙的游记则流水账一般记述了几个片段,大概可能是因为内蒙的行程会更开心一点的缘故吧。
另一个统计是对我旅行时拍摄照片的焦段。每次出游相机都是我又爱又恨的存在,恨是因为真的重,爱是因为画质真的好,为了精简我带出去的镜头,我把自己在吉隆坡、槟城、大同、正定、金泽、朔州、呼伦贝尔的照片做了个梳理,选择了我认为还算不错的照片,统计了它们的焦段。
我发现 90% 的照片焦段都在 105mm 以内。而一旦超过 120mm,剩下的照片焦段大概率会直接跳到 240mm。
使用 240mm 拍摄的照片,以城市观景台、落日、云朵和动物居多,这几个场景其实我需要的可能不是 240mm,而是挂机头最大只到 240mm。
也就是说如果我能预判如果不拍摄上面几个题材,我大概率可以考虑把挂机头从 RF 24-240 换成 RF 24-105,以获得更好的夜景和人像表现,并且从此可以少带一个镜头(我有的时候需要带 RF 24-70 F2.8 和 RF 24-240 两个镜头。
正当我准备兴冲冲地研究要不要下单 RF 24-105 F2.8 时,我突然意识到自己很少拍人像(没有拍摄的机会),夜景也几乎不拍。笑死,买个屁,不买立省 100%。
上面两个算是借助数据分析的方法更了解自己的小故事。
第二季度快结束了,第三季度去哪儿呢?考虑到 7,8 月份是暑假,我大概率不会出去玩,所以第三季度的游记估计要和第四季度的合并了。
可以明确的是我已经挑好了中秋节去日本的机票了,这次计划的地点是日本的兵库县,会前往姬路和神户。十一去哪儿,目前还没有想好,但大概率也不会在国内(也不会去日本),因为实在是太挤了。
此外我一定会在今年挑一个下雪的日子去烟台看看,算是北海道平替了(笑)。
2024-06-15 00:52:00
米其林发布了杭州的美食指南,无论是杭州(某些人口中的知名美食荒漠)还是米其林本身都是极具争议的存在,借这个机会浅浅聊一下关于如何衡量一个东西好不好吃这件事情的一些想法。
每次遇到一个比较会吃的人时,我都会请教几个问题:
【1】对于吃饭这件事情,这个评价体系是客观还是主观的?
【2】如何建立对于一个东西是否好吃的评价体系?
【3】怎么看待很多传统菜肴中对于食材和技法的要求?
下面的说法都是我的一己之见,如果有道理一定是其他老师给我的启发,没道理那是我自己胡说八道。
针对【问题 1】
首先,吃饭是一个很主观的事情,一定会受到其成长环境的影响,所以我们可以认为一个人对食物的喜好是社会构建大于自然构建的,时至今日,我往往会用“我喜欢/我不喜欢”来评定食物,很少用“好吃/不好吃”这样的评价,除非是真的难吃。
其次,一个餐厅是否值得去,排除食品的味道,价格、距离、菜品丰富程度、服务水平、用餐目的都会影响最终结果,所以要把对食物的评价和对餐厅的评价一分为二分开来说。
第三,如果一个人很擅长烹饪,那么 TA 的评价体系相比于主观会趋向于客观,因为烹饪学习的过程是科学、实践和广泛取材的过程,这些会稀释个人成长经历给其带来的喜好。
关于第三点,我自己认为如果一个人更偏向于消费者的角色,那 TA 的喜好主要是社会构建的,如果一个人更偏向于生产者的角色,那么 TA 的喜好会偏向自然(科学)构建。
针对【问题2】
首先,要放宽心态,要有广博的心态去尝试。
其次,多吃,多吃就会发现好的和不好的。
第三,不同的食材,尤其是所谓的平民美食,不可能做到面面俱到,要擅长发现某道菜试图给食客提供的爽点在哪,比如有的菜就是吃口感。
针对【问题 3】
首先,要理解餐厅制作食物是一种经营活动,好吃并不是餐厅的追求,赚钱才是。
其次,要理解菜品,以及烹饪菜品的要求是客观烹饪条件(科技水平)、当地文化、当地物产、餐厅经营策略的共同产物。
第三,如果纯粹以口味作为单一衡量标准,不考虑文化因素,传统的烹饪要求(主要体现在用料上面)按照现在的条件来看很有可能是一种固步自封。
所以再让我们看看米其林指南,米其林指南本质是写给游客的指南。游客有什么特点?
一、对当地文化不熟悉,有自己的一套评价体系,有自己的喜好。
二、没有建立起对当地食品的评价体系。
三、旅行过程中对餐厅要求会更高,比如要求更加干净,本来去个陌生地方就可能水土不服,再来吃个生腌之类的,不就原地升天了吗?
四、游客的支付能力普遍更强,毕竟来都来了。
看完这几个要求,是不是就觉得米其林的奇怪标准也不这么奇怪了呢?毕竟游客看这份指南的目的是享受而不是猎奇,对老外来说吃宫保鸡丁可以,吃皮蛋就太强人所难了。
而且就我自己来说,如果不是看了付霞的《鱼翅与花椒》,我是很抗拒吃爆肚、鹅肠这类食物的,作为一个中国人我都得靠英国人写的中餐相关的书籍才能接受一部分中国食物,怎么可能要求游客能够天然接受每个地方的食物呢?
当然,上面所说的一切,都会导致米其林整体评价单一并且浅尝辄止,很像是一个嘴巴上说喜欢亚洲文化但是连中日韩三国文字都分不清的老白男。甚至很多时候我能够从餐厅上面感受到,米其林真的很努力在本土化了,但是其实在我看来这是没必要的,一来是不够懂,二来游客指南本身就是有价值的。
毕竟游客是来旅游的,不是来做社会学调查的,更不是来受罪的。
但是正因为米其林是游客指南,我更认为一个地区如果对自己的饮食文化是有想法的,希望捍卫乃至发扬光大自己的饮食文化,那么推出自己的评价体系是一件很有必要的事情。
毕竟,我不想吃跟法餐一样的中餐。
但是就我个人而言,我认为米其林的分级标准是非常浪漫的,作为对比,我们可以先看一下黑珍珠的三个等级的描述:
真的是俗死了,尤其是那个一生必吃一次的说法。
作为对应,米其林的餐厅分级标准是这么描述的:
可以说是恰如其分,因为去餐厅吃饭,排除金钱成本,其实最大的成本就是路程,为了一家餐厅安排一次旅行,这世界上还有比这更浪漫的事情吗?没有了,浪漫这件事情,还是法国人更擅长一些,当然,这也可能是轮胎厂的阴谋。
就好像爆肚,蠢得要死,又很贵,为什么就有人喜欢吃?其实就是为了那个口感。这个世界上大部分食物都是这样的,缺陷很多,但是又有无数人为了那一瞬间的爽点,可以付出时间、金钱的代价。
为了一坛绝妙的醋去包一盘饺子,这才是人生的正经事啊!