不能绝对的相信AI的回答

zlq_hysy · 发表于 2025-6-26 22:27:35

本帖最后由 zlq_hysy 于 2025-6-26 22:31 编辑

1、问了豆包一个问题，某路上的某银行搬迁到哪里去了？他回答是搬迁到了A路的239号，我到达A路，跑断腿也没找到239号，后来返回到旧址，看到大门上写着本行已搬迁到B路239号，后来去B路终于找到了。
2、问豆包一个问题、；根据图片说出电影名字。

豆包的回答是：

这是电影《奥托・布鲁姆的一生》（The Death and Life of Otto Bloom ）中的画面。影片是澳大利亚的科幻剧情片，图中人物是安迪（Andy ），情节围绕他在小镇的经历展开，包括开车遇女警检查等情节。

但是简单的看了一下这部类似记录片的电影，感觉情节上相差太远。

3、把同样的问题交个百度的DeepSeek-R1

得到的答案是：

这部电影的名字是‌《变形金刚4：绝迹重生》‌。

从图片中的关键信息可以推断，图中展示的是电影中的一个场景，‌女警与角色安迪的互动‌。

结合已知信息，该场景出自‌《变形金刚4：绝迹重生》‌，这是一部充满动作与科幻元素的电影，讲述了汽车人与霸天虎的新一轮战斗。

我咋觉得与变形金刚更扯不上边呢？

cooyoo · 发表于 2025-8-18 18:05:51

确实，AI有时候乱来，不能完全放心

Flow · 发表于 2025-8-18 15:58:42

本帖最后由 Flow 于 2025-8-18 15:59 编辑

lhc0688 发表于 2025-8-17 07:06
目前的主流大模型在专业领域考试上轻松超越80%以上考生，数学、逻辑、代码等评测准确度可以达到98%以上， ...

上面没限定讨论范围，比如对“社科类”历史、哲学等单选问题，有时候问它几次，给几次不同答案。解释还自相矛盾。各大模型同时测试，基本上都有这个问题。

rrrnnn · 发表于 2025-8-17 19:22:14

lhc0688 发表于 2025-8-17 18:08
首先，AI能否用来查找影片资料，答案当然能！目前很多以图识影片的网站、应用，基本都用到AI技术，典型的 ...

说来说去，还是有个影片库，靠网络信息来喂养他，如果没有这些AI在分析也没用，那我说的有错吗？这些库存信息都来自网络，AI通过你提供的信息去检索这些库存信息来给你答案，如果找不到就胡乱猜答案。AI没办法去判断一个从来没有任何信息的图片来给你提供答案。就像是输入法词库一样，你输入的任何可以组成词汇的拼音都不是凭空出现的。

lhc0688 · 发表于 2025-8-17 18:08:46

rrrnnn 发表于 2025-8-17 16:32
那我请你解释下，你给张电影截图给AI，让它分析这是出自哪一部电影，具体是哪一分钟，请问AI给出的答案是 ...

首先，AI能否用来查找影片资料，答案当然能！目前很多以图识影片的网站、应用，基本都用到AI技术，典型的就是谷歌识图。你可以把图片发给谷歌，然后检索看下。

其次，针对一个已经发布的ai大模型而言，为何你会认为它应该能帮你查找电影资料？比如Meta 的llama 3，2024年发布，你截图个2025年的《戏台》，问它是什么电影，你觉得它应该知道吗？还有，存世的影片、视频数以亿万计，这些影片ai都应该认识吗？

ai在影像资料检索方面发挥的作用是：通过图像理解，识别出其中的人物或特定信息，比如识别出马龙白兰度，场景是四十年代的美国，然后将识别的结果给到算法，算法再算出可能匹配的结果是《教父》，然后通过搜索引擎检索输出。

所以，ai大模型本身不是用来检索图片资料数据，是用来理解图像的。

举例：

识别图像有哪些元素，包括图片风格，以便编辑模型对图像、视频再处理，比如换脸；
识别图像、视频是否违规，比如nsfw审查；
读取一段视频，并找出特定的画面帧，比如包含某个车牌；
用一张肖像，推理出其年轻、年老时候的长相等等；

针对不同需求，大模型训练数据集也会有不同侧重，比如图像编辑模型，其数据标注会侧重图片元素。如果要图片识别电影，那数据集则要侧重标注：电影名称、导演、演员等，但这样做意义不大，用AI+本地资料库方案（AGI）更适合；

rrrnnn · 发表于 2025-8-17 16:32:24

lhc0688 发表于 2025-8-17 06:38
你说的那叫谷歌搜索里面的以图搜图，跟ai识图完全不是一回事。

ai识图说的是理解图像，有专门的模型， ...

那我请你解释下，你给张电影截图给AI，让它分析这是出自哪一部电影，具体是哪一分钟，请问AI给出的答案是怎么得到的？它又是如何肯定答案的？

zhang1209 · 发表于 2025-8-17 13:55:41

豆包生成的图片还是不错的，要合理利用ai

小龙飞 · 发表于 2025-8-17 10:47:23

感谢您的分享！

lhc0688 · 发表于 2025-8-17 10:41:20

什么都不说吧发表于 2025-8-17 07:37
ai经常是一本正经地胡说八道，必须要有鉴别能力，不然上当上死人。关键ai的语气，完全它就是专家的样子，一 ...

gpt2刚问世时候，人们评论这种大语言模型的一个特征，就是存在幻觉（会一本正经地胡说八道），这是人类初次接触新一代大模型的一个体验。

往坏处讲：“一本正经”会给人专业的错觉，“胡说八道”又对人产生误导，这是后期模型改进的方面；
往好处讲：“一本正经”会满足指定的风格要求，“胡说八道”又能更大程度体现想象力，这是模型发挥力的方面；

举个例子：让ai画一幅梵高的牡丹图，ai就能”一本正经“地展现出梵高的风格，同时又”胡说八道“画出牡丹；
再比如，让ai生成一段猫咪说话的视频，声音是马老师的，结果你会看到一只猫咪在用马老师的声音”胡说八道“。

这就是大语言模型的一个特征，你不能简单说是坏是好。

owangyue12 · 发表于 2025-8-17 10:28:08

同样的问题,ai隔段时间回答不一样

zds1210 · 发表于 2025-8-17 10:20:13

就deepseek解决理科问题确实厉害啊，其它的就像白痴。

lhc0688 · 发表于 2025-8-17 10:14:28

窄口牛发表于 2025-8-17 08:30
你说的行业应用ai，楼主说的是生成式ai，两码事。

你可以叫大语言模型，可以叫生成式ai，可以叫卷积运算，可以叫神经网络，可以叫检查点，可以叫嵌入式，可以叫lora，可以叫文本倒装。。。。，但就是别说分为“行业应用ai与生成式ai”，会让人感觉太外行。

窄口牛 · 发表于 2025-8-17 08:30:27

lhc0688 发表于 2025-8-17 06:38
你说的那叫谷歌搜索里面的以图搜图，跟ai识图完全不是一回事。

ai识图说的是理解图像，有专门的模型， ...

你说的行业应用ai，楼主说的是生成式ai，两码事。

sjp060305 · 发表于 2025-8-17 08:00:13

☆.。.:*(嘿´Д｀嘿).。.:*☆

win98se · 发表于 2025-8-17 07:51:14

看了楼上各位的讨论，感觉对AI又有了一层新认识

tzblue · 发表于 2025-8-17 07:47:51

可以作为参考，但不能以行业标准来要求或者期望得到想要的结果，容易出现偏差。

什么都不说吧 · 发表于 2025-8-17 07:37:18

ai经常是一本正经地胡说八道，必须要有鉴别能力，不然上当上死人。关键ai的语气，完全它就是专家的样子，一般才接触的人特别容易上当。

temp2005 · 发表于 2025-8-17 07:26:31

邪恶海盗发表于 2025-6-26 22:40
人工智障你也信...

从不用这个，只信百度

lhc0688 · 发表于 2025-8-17 07:06:45

Flow 发表于 2025-8-16 21:42
现在AI进步确实非常大，但在对问题的解决上，还是和专业的人有差距。

目前的主流大模型在专业领域考试上轻松超越80%以上考生，数学、逻辑、代码等评测准确度可以达到98%以上，这样的成绩有几个专业人士能做到？

lhc0688 · 发表于 2025-8-17 07:01:00

jxls 发表于 2025-8-16 19:47
AI太机械化了

恰恰相反，ai模型目前最大的问题就是不能机械化！专业点说就是“解决ai大模型的ID一致性问题”。ai不能像机械一样按程控运行，不能按物理规律保持前后一致，ai过于天马行空，不能像机械一样进行操控。

ai能展现超越人类的想象力，却不能像机械一样受控，这是目前ai大模型攻关的难点。

lhc0688 · 发表于 2025-8-17 06:38:45

rrrnnn 发表于 2025-8-16 22:00
你给个图片让AI分析，不过只是识图找答案罢了，答案来自互联网，而且识图也不一定会搜到带有你截图的这张图 ...

你说的那叫谷歌搜索里面的以图搜图，跟ai识图完全不是一回事。

ai识图说的是理解图像，有专门的模型，已经有非常多的应用，叫“根据图片反推提示词”，更强大的还有根据视频反推提示词。
ai识图模型可以实现对图片的理解：人物是什么样的，亚洲人或者黑人，金发还是黑发，盘头还是短发，表情严肃还是在微笑，穿的什么衣服，每件衣服什么颜色，手里拿了什么东西，人物在干什么，背景怎样，图片整体什么风格，是动漫还是人像摄影，油画、赛博朋克、吉普力等等。

能理解图像是ai质的飞跃，也是图像编辑大模型的基础。比如，你可以用如下提示文本让模型编辑图像：把上衣换成红色、让裙子换成短裤、让她拿着手机、把图片风格转为赛博风、背景换成海边、把无关人物清除、等等。

同样，ai也能理解视频，比如在一段视频中找出某个人物、事物出现的位置（可以应用到监控视频检索等），可以修改、替换指定的视频内容，比如换脸，更换视频风格，等等。

ai模型的能力和发展速度远非你们的想象，不要再盲人摸象，拿几十年前的认知来评论自己没用过的东西了。

rrrnnn · 发表于 2025-8-16 22:00:36

你给个图片让AI分析，不过只是识图找答案罢了，答案来自互联网，而且识图也不一定会搜到带有你截图的这张图文的电影剧集的介绍，你怎么会认为AI能回答你？他只能找到和你图片相近的文章并提炼出答案。

Flow · 发表于 2025-8-16 21:42:23

现在AI进步确实非常大，但在对问题的解决上，还是和专业的人有差距。

lhc0688 · 发表于 2025-8-16 21:05:19

漂亮国几大科技巨头投资5千亿美金买显卡建算力中心，就为了不被抛下AI赛道，meta花4亿美金挖一个AI工程师，英伟达市值超两万亿。。。。

再看咱们这个曾经IT界大名鼎鼎的无忧启动论坛，现在已经没落到何等地步。看看论坛里那些莫名其妙、不知所云的发帖，老气横秋、自以为是的争论，但凡有点脑子都不会如此，毕竟好赖也是一群混IT论坛的人。

jxls · 发表于 2025-8-16 19:47:33

AI太机械化了

2013taburise · 发表于 2025-8-16 19:33:50

2013taburise 发表于 2025-8-16 19:32
AI的原理其实可以理解成高级的“输入法联想”，就是根据训练语料的概率，计算一大堆语言素材之后，下一个文 ...

比如我现在给公司做点简单的二次开发，已经可以直接把需求扔给AI，让AI自己写代码了，写的不对就把问题告诉AI让AI重写就行，多一半可用

2013taburise · 发表于 2025-8-16 19:32:35

AI的原理其实可以理解成高级的“输入法联想”，就是根据训练语料的概率，计算一大堆语言素材之后，下一个文字出现的概率，所以你问这种即时信息百分百是错的，你要是问某种编程语言的问题，或者让它模仿谁的风格写个散文还算有可能

lhc0688 · 发表于 2025-8-16 19:10:39

本帖最后由 lhc0688 于 2025-8-18 15:49 编辑

发个用AI编辑图片的小例子.

lhc0688 · 发表于 2025-8-16 18:13:50

本帖最后由 lhc0688 于 2025-8-16 19:27 编辑

AI玩的就是幻觉，说得文雅点就是想象力。比如你要让它画一幅画、做一首曲，这就需要AI有幻觉才行，不然它只会原版照抄（术语叫过拟合）；

AI模型也需要专业对口，比如写代码的、数学运算的、处理图像的、视频的、声音的、或者某个专业医学领域的，你需要找对口的模型用才行；

说AI是数据检索，两年前gpt刚推出时候这样说还有情可原，毕竟刚开始很多人不太理解，现在AI已经无处不在，已经大量参与到各种科技、生产力、生活之中，包括高精尖的无人驾驶飞控格斗，包括大量图像、视频、音频创作、编辑等等领域。就举一个小例子：两年前电商拍商品展示的模特月入百万，现在大多已经无人问津了。再比如两年前印度人凭着程序代工，在科技大公司大行其道，硅谷几大巨头几乎都被其包揽，现在却让位给华人，现在已是算法为王。

AI能玩、好玩的东西太多了，别在抱残守旧、不懂瞎评论了，换台好点的电脑，实际去玩下，你会发现一片奇妙无比的新世界。

szwp · 发表于 2025-8-16 17:28:28

绝对意味终结

		自动登录	找回密码
密码			注册

[讨论] 不能绝对的相信AI的回答

点评

点评

点评

点评

点评

点评

点评

浏览过的版块