使用AI大模型(Gemini/GPT4/文心一言/Kimi)选择电动牙刷
文章目录
本篇不是评测,而是介绍一些使用思路,让小曾同学熟练使用AI工具解决生活问题。
1score_9, score_8_up, score_7_up, solo, 1girl, pokemonkahili, expressionless, looking at viewer, squatting, ahoge, visor cap, striped shirt, white gloves, single glove, blue skirt, outdoors, tennis court <lora:style_tarakanovich_ponyXL:1> <lora:pokemon_kahili_ponyXL:1>
2Negative prompt: monochrome, simple background
3Steps: 20, RNG: CPU, VAE: sdxl_vae.safetensors, Size: 832x1216, Seed: 1621551946, Model: autismmixSDXL_autismmixPony, Version: f0.0.17v1.8.0rc-latest-276-g29be1da7, Sampler: Euler A SGMUniform, CFG scale: 6, Clip skip: 2, Mask blur: 4, Model hash: 821aa5537f, Inpaint area: Only masked, ADetailer model: face_yolov8m.pt, ADetailer version: 24.3.1, Denoising strength: 0.4, ADetailer mask blur: 4, Masked area padding: 32, ADetailer confidence: 0.3, ADetailer dilate erode: 4, ADetailer inpaint padding: 32, ADetailer denoising strength: 0.4, ADetailer inpaint only masked: True
这也是2024计划 曾老师的AI课 的第一篇。
小曾同学发了个任务过来,让我给选个电动牙刷。
这是一个测试AI大模型能力的机会。
选择标准
要在两个消费产品中做选择,主要标准一般逃不出这三条:
- 颜值
- 功能与特点匹配
- 价格,或者说性能/质量价格比例
其中1是主观的,3价格是基本确定的。大模型解决的主要是2的问题。
我们使用了两个海外,两个国内大模型:
- Google Gemini
- ChatGPT 4
- 文心一言
- Kimi
五个问题
我们设计了5个问题,依次检测大模型的能力:
- 请推荐电动牙刷。(测试盲选能力)
- 请推荐国产电动牙刷。(测试对国产设备的理解)
- 国产电动牙刷中,usmile 和 laifen 这两个品牌,你看好哪一个?(强迫大模型给出二选一建议)
- 请在「什么值得买」网站中,查找这两个品牌的相关介绍,根据信息推荐一款牙刷。(测试联网能力)
- 在京东热榜中,搜索这两个品牌的购买热度数据。(联网数据分析能力)
推荐电动牙刷
Gemini 采用分类给出建议的方式,对于普通用户是更有有价值的。
比较两个海外大模型,都给出了具体的品牌和型号。两个国内大模型在回答的时候,更多是罗列产品数据。
推荐国产电动牙刷
Gemini 依然是同样的味道。GPT4 表现也不错。
文心一言推荐相对简洁。Kimi 给出了搜索 9 篇网络资料后的分析结果。
国产电动牙刷中,usmile 和 laifen 这两个品牌,你看好哪一个?
Gemini 是唯一给出了偏好的大模型,优劣的说明也很明确,其他的大模型都在打太极。
文心一言的分析足够全面和具体,最终还是打太极。
请在「什么值得买」网站中,查找这两个品牌的相关介绍,根据信息推荐一款牙刷
GPT4 是表现最好的,它真的去访问了网站,也给出了明确的选项。感觉Gemini在胡说八道。
Kimi 的5篇资料中只有2篇来自于张大妈,并没有啥新的内容。
在京东热榜中,搜索这两个品牌的购买热度数据
Gemini表现明显超越其他几个模型了。
GPT4无法搜到 laifen 这个品牌,所以我换了一个问题,似乎又被转换成了英文。下图中2、3两张图都是 GPT4。
文心一言直接放弃说臣妾我做不到啊。Kimi 倒是同样的讨论,说臣妾做不到然后分析参考文章。
结论
上面对于各模型的比较并不严谨,但有普通用户的代表性。
从分析方式看,Gemini是胜出的,也是唯一一个获取到京东热榜数据的大模型(尽管我也不知道是不是它编的😄)。
GPT4 访问网络资源的能力十分出色。
文心一言中规中矩。
Kimi 的特点是实时搜索资料并立即分析。
人类工作量
人类问题的终极答案,当然还是要上一点人类工作量。所以我人肉比较了一下京东热卖和官网信息:
- 京东热卖榜中,usmile 的热卖榜搜索优化相当好,前列的全是官方产品。而徕芬的热卖榜前面不知道是些啥,翻了一页才看到官方产品信息。 显然 usmile 的营销做得更专业。
- 两者的单品最高销售量都能达到20万+。
- usmile 专做口腔相关产品,有冲牙器、电动牙刷、牙膏、牙线。徕芬做电动牙刷之前,只做高速吹风机,貌似还做的不错。
- 官方牙刷头,徕芬价格合理,usmile 过高。
核心选择点
最终小曾同学选择的是徕芬,理由如下:
- 高速吹风机和电动牙刷的核心部件都是电机。
- usmile 的宣传做得太好了,不知道是否能在产品上下同样的功夫。
- usmile 的原装刷头过于昂贵,很难不联想到买刀片送刮胡刀的吉列,以及买墨盒送打印机的爱普生。
- 扫振一体这个宣传点已将小曾同学洗脑。
- 文章ID:2825
- 原文作者:zrong
- 原文链接:https://blog.zengrong.net/post/gemini-gpt4-yiyan-kimi-electric-toothbrush/
- 版权声明:本作品采用 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 进行许可,非商业转载请注明出处(原文作者,原文链接),商业转载请联系作者获得授权。