消费折叠

每一个平替商品的搜索技巧背后都隐藏着一种对生活的折叠

起因是我看到了一条帖子讲如何通过替换搜索词实现以更低的价格购买相同功能的商品例如

瑜伽垫 -> 瑜伽垫男
照片墙 -> 渔网
野餐布 -> 防水桌布
...

我试了一下有些技巧已经失效了有些的确便宜许多于是我在小红书搜索替换词发现许多收藏过万的帖子它们通常是一组图片每张图都是新/旧商品名的对照列表如下所示

小红书上的替换词照片

这些对照表很好但不好用当我真的想搜某个商品时我需要先对着密密麻麻的图表查找不仅如此当我想搜的商品不在列表里时它就失效了我想能否用 AI 来实现这个任务呢训练一个模型用户输入想搜索的商品模型给出便宜的平替商品名

我很快整理了一些数据并开始训练模型OpenAI 已经支持finetune 模型了你只需要把数据导出并上传就可以自动开始训练我选择的模型是gpt-3.5-1106训练花费了大概 10 分钟最后我搭建了一个网页用于模型调用得益于开发工具的完善我只用了一下午就完成了这个 demo 产品

消费折叠

网页开发最快乐的部分是注册域名很快我就选好了网址: pingti.xyz便宜好记并让所有朋友都试了试很多人都觉得好玩虽然有些结果比较离谱(牙膏->足浴店小样, iPhone->二手 iPhone, 唇膏->蜡烛)但有些还是蛮有用的至少模型可以记住截图里的平替词不必一个个找了

朋友的一些测试结果

仍然有一些比较差的结果我开始思考怎么优化这使我不得不仔细分析原始训练数据看看模式上有什么规律总结如下

  • 性别套利: 例如瑜伽垫->瑜伽垫男遮阳伞->雨伞男这背后反应的其实是男人比女人更在乎实用性和性价比更少为了颜值设计而买单而设计产生了成本
  • 场景套利: 例如马甲->老头马甲因为老年人更在乎价格, 女包->包包尾货这个不用解释, 地毯->办公室地毯, 书桌->培训桌, 椅子->婚礼用椅是因为在办公室培训举办婚礼时通常会使用更便宜的材质吗
  • 地域套利: 例如袜子->诸暨袜子, 耳饰->义乌耳饰因为中国的袜子主要来自诸暨所以通过指定原产地可以获得更低的价格
  • 无法归类: 这一类最有意思它们的特点是两个商品几乎八竿子打不着但是它们在功能上可以实现接近平替的效果例如照片墙->渔网, 相框->营业执照框, 面膜收纳->食品保鲜盒, iPad支架->菜谱架, 美甲灯->验钞灯, 乐高防尘罩->超市陈列盒这其中每个平替商品的搜索技巧背后都隐藏着一种对生活的折叠不信你可以仔细品味

我意识到靠简单的 finetune 模型也许可以学会前两种套利模式叠加规则(给商品分配相应产业的城市)也许可以学会第三种模式但学会最后一类平替方式几乎不可能即使是人类也需要大量的实践积累才能摸索出其中的奥妙

郝景芳在北京折叠中讲述了不同社会阶层在空间和时间上的折叠我觉得商品平替似乎是这种折叠所露出的缝隙我回想起自己第一次购买维生素 C 的场景在知乎上搜汤臣倍健的维生素 C 和医院有什么差别结论是前者比较甜后来每次我都买东北制药维生素 C二者价格差了 100 倍

经济下行每个人都在缩减开支想象一下未来的某一天我坐在婚礼专用椅上墙上挂着一张渔网上面是我的照片我面前的培训桌上摆着菜谱架iPad 正在播放视频 这个场景还蛮好笑的但人生还要继续无论商品怎样平替人生是无法平替的重要的不是渔网而是渔网上的照片