使用AI大模型(Gemini/GPT4/文心一言/Kimi)选择电动牙刷

文章目录

本篇不是评测,而是介绍一些使用思路,让小曾同学熟练使用AI工具解决生活问题。

封面图AI生成,参数如下:

1score_9, score_8_up, score_7_up, solo, 1girl, pokemonkahili, expressionless, looking at viewer, squatting, ahoge, visor cap, striped shirt, white gloves, single glove, blue skirt, outdoors, tennis court <lora:style_tarakanovich_ponyXL:1> <lora:pokemon_kahili_ponyXL:1>
2Negative prompt: monochrome, simple background
3Steps: 20, RNG: CPU, VAE: sdxl_vae.safetensors, Size: 832x1216, Seed: 1621551946, Model: autismmixSDXL_autismmixPony, Version: f0.0.17v1.8.0rc-latest-276-g29be1da7, Sampler: Euler A SGMUniform, CFG scale: 6, Clip skip: 2, Mask blur: 4, Model hash: 821aa5537f, Inpaint area: Only masked, ADetailer model: face_yolov8m.pt, ADetailer version: 24.3.1, Denoising strength: 0.4, ADetailer mask blur: 4, Masked area padding: 32, ADetailer confidence: 0.3, ADetailer dilate erode: 4, ADetailer inpaint padding: 32, ADetailer denoising strength: 0.4, ADetailer inpaint only masked: True

这也是2024计划 曾老师的AI课 的第一篇。


小曾同学发了个任务过来,让我给选个电动牙刷。

小曾同学要选电动牙刷

这是一个测试AI大模型能力的机会。

选择标准

要在两个消费产品中做选择,主要标准一般逃不出这三条:

  1. 颜值
  2. 功能与特点匹配
  3. 价格,或者说性能/质量价格比例

其中1是主观的,3价格是基本确定的。大模型解决的主要是2的问题。

我们使用了两个海外,两个国内大模型:

  • Google Gemini
  • ChatGPT 4
  • 文心一言
  • Kimi

五个问题

我们设计了5个问题,依次检测大模型的能力:

  • 请推荐电动牙刷。(测试盲选能力)
  • 请推荐国产电动牙刷。(测试对国产设备的理解)
  • 国产电动牙刷中,usmile 和 laifen 这两个品牌,你看好哪一个?(强迫大模型给出二选一建议)
  • 请在「什么值得买」网站中,查找这两个品牌的相关介绍,根据信息推荐一款牙刷。(测试联网能力)
  • 在京东热榜中,搜索这两个品牌的购买热度数据。(联网数据分析能力)

推荐电动牙刷

Gemini 采用分类给出建议的方式,对于普通用户是更有有价值的。

比较两个海外大模型,都给出了具体的品牌和型号。两个国内大模型在回答的时候,更多是罗列产品数据。

Gemini/GPT4/文心一言/Kimi 推荐电动牙刷

推荐国产电动牙刷

Gemini 依然是同样的味道。GPT4 表现也不错。

文心一言推荐相对简洁。Kimi 给出了搜索 9 篇网络资料后的分析结果。

Gemini/GPT4/文心一言/Kimi 推荐国产电动牙刷

国产电动牙刷中,usmile 和 laifen 这两个品牌,你看好哪一个?

Gemini 是唯一给出了偏好的大模型,优劣的说明也很明确,其他的大模型都在打太极。

文心一言的分析足够全面和具体,最终还是打太极。

Gemini/GPT4/文心一言/Kimi 比较两个品牌

请在「什么值得买」网站中,查找这两个品牌的相关介绍,根据信息推荐一款牙刷

GPT4 是表现最好的,它真的去访问了网站,也给出了明确的选项。感觉Gemini在胡说八道。

Kimi 的5篇资料中只有2篇来自于张大妈,并没有啥新的内容。

Gemini/GPT4/文心一言/Kimi 和色魔张大妈

在京东热榜中,搜索这两个品牌的购买热度数据

Gemini表现明显超越其他几个模型了。

GPT4无法搜到 laifen 这个品牌,所以我换了一个问题,似乎又被转换成了英文。下图中2、3两张图都是 GPT4。

文心一言直接放弃说臣妾我做不到啊。Kimi 倒是同样的讨论,说臣妾做不到然后分析参考文章。

Gemini/GPT4/文心一言/Kimi 和京东热榜

结论

上面对于各模型的比较并不严谨,但有普通用户的代表性。

从分析方式看,Gemini是胜出的,也是唯一一个获取到京东热榜数据的大模型(尽管我也不知道是不是它编的😄)。

GPT4 访问网络资源的能力十分出色。

文心一言中规中矩。

Kimi 的特点是实时搜索资料并立即分析。

人类工作量

人类问题的终极答案,当然还是要上一点人类工作量。所以我人肉比较了一下京东热卖和官网信息:

  1. 京东热卖榜中,usmile 的热卖榜搜索优化相当好,前列的全是官方产品。而徕芬的热卖榜前面不知道是些啥,翻了一页才看到官方产品信息。 显然 usmile 的营销做得更专业。
  2. 两者的单品最高销售量都能达到20万+。
  3. usmile 专做口腔相关产品,有冲牙器、电动牙刷、牙膏、牙线。徕芬做电动牙刷之前,只做高速吹风机,貌似还做的不错。
  4. 官方牙刷头,徕芬价格合理,usmile 过高。

核心选择点

最终小曾同学选择的是徕芬,理由如下:

  1. 高速吹风机和电动牙刷的核心部件都是电机。
  2. usmile 的宣传做得太好了,不知道是否能在产品上下同样的功夫。
  3. usmile 的原装刷头过于昂贵,很难不联想到买刀片送刮胡刀的吉列,以及买墨盒送打印机的爱普生。
  4. 扫振一体这个宣传点已将小曾同学洗脑。
全文完