无忧启动论坛

 找回密码
 注册
搜索
系统gho:最纯净好用系统下载站投放广告、加入VIP会员,请联系 微信:wuyouceo
查看: 10254|回复: 105
打印 上一主题 下一主题

[讨论] 不能绝对的相信AI的回答

  [复制链接]
跳转到指定楼层
#
发表于 2025-6-26 22:27:35 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
本帖最后由 zlq_hysy 于 2025-6-26 22:31 编辑

1、问了豆包一个问题,某路上的某银行搬迁到哪里去了?他回答是搬迁到了A路的239号,我到达A路,跑断腿也没找到239号,后来返回到旧址,看到大门上写着本行已搬迁到B路239号,后来去B路终于找到了。
2、问豆包一个问题、;根据图片说出电影名字。



豆包的回答是:

这是电影《奥托・布鲁姆的一生》(The Death and Life of Otto Bloom )中的画面。影片是澳大利亚的科幻剧情片,图中人物是安迪(Andy ),情节围绕他在小镇的经历展开,包括开车遇女警检查等情节 。


但是简单的看了一下这部类似记录片的电影,感觉情节上相差太远。


3、把同样的问题交个百度的DeepSeek-R1


得到的答案是:


这部电影的名字是‌《变形金刚4:绝迹重生》‌。

从图片中的关键信息可以推断,图中展示的是电影中的一个场景,‌女警与角色安迪的互动‌。

结合已知信息,该场景出自‌《变形金刚4:绝迹重生》‌,这是一部充满动作与科幻元素的电影,讲述了汽车人与霸天虎的新一轮战斗。


我咋觉得与变形金刚更扯不上边呢?




102#
发表于 2025-8-18 18:05:51 | 只看该作者
确实,AI有时候乱来,不能完全放心
回复

使用道具 举报

101#
发表于 2025-8-18 15:58:42 | 只看该作者
本帖最后由 Flow 于 2025-8-18 15:59 编辑
lhc0688 发表于 2025-8-17 07:06
目前的主流大模型在专业领域考试上轻松超越80%以上考生,数学、逻辑、代码等评测准确度可以达到98%以上, ...

上面没限定讨论范围,比如对“社科类”历史、哲学等单选问题,有时候问它几次,给几次不同答案。解释还自相矛盾。各大模型同时测试,基本上都有这个问题。
回复

使用道具 举报

100#
发表于 2025-8-17 19:22:14 | 只看该作者
lhc0688 发表于 2025-8-17 18:08
首先,AI能否用来查找影片资料,答案当然能!目前很多以图识影片的网站、应用,基本都用到AI技术,典型的 ...

说来说去,还是有个影片库,靠网络信息来喂养他,如果没有这些AI在分析也没用,那我说的有错吗?这些库存信息都来自网络,AI通过你提供的信息去检索这些库存信息来给你答案,如果找不到就胡乱猜答案。AI没办法去判断一个从来没有任何信息的图片来给你提供答案。就像是输入法词库一样,你输入的任何可以组成词汇的拼音都不是凭空出现的。
回复

使用道具 举报

99#
发表于 2025-8-17 18:08:46 | 只看该作者
rrrnnn 发表于 2025-8-17 16:32
那我请你解释下,你给张电影截图给AI,让它分析这是出自哪一部电影,具体是哪一分钟,请问AI给出的答案是 ...

首先,AI能否用来查找影片资料,答案当然能!目前很多以图识影片的网站、应用,基本都用到AI技术,典型的就是谷歌识图。你可以把图片发给谷歌,然后检索看下。

其次,针对一个已经发布的ai大模型而言,为何你会认为它应该能帮你查找电影资料?比如Meta 的llama 3,2024年发布,你截图个2025年的《戏台》,问它是什么电影,你觉得它应该知道吗?还有,存世的影片、视频数以亿万计,这些影片ai都应该认识吗?

ai在影像资料检索方面发挥的作用是:通过图像理解,识别出其中的人物或特定信息,比如识别出马龙白兰度,场景是四十年代的美国,然后将识别的结果给到算法,算法再算出可能匹配的结果是《教父》,然后通过搜索引擎检索输出。

所以,ai大模型本身不是用来检索图片资料数据,是用来理解图像的。

举例:

识别图像有哪些元素,包括图片风格,以便编辑模型对图像、视频再处理,比如换脸;
识别图像、视频是否违规,比如nsfw审查;
读取一段视频,并找出特定的画面帧,比如包含某个车牌;
用一张肖像,推理出其年轻、年老时候的长相等等;

针对不同需求,大模型训练数据集也会有不同侧重,比如图像编辑模型,其数据标注会侧重图片元素。如果要图片识别电影,那数据集则要侧重标注:电影名称、导演、演员等,但这样做意义不大,用AI+本地资料库方案(AGI)更适合;






点评

说来说去,还是有个影片库,靠网络信息来喂养他,如果没有这些AI在分析也没用,那我说的有错吗?这些库存信息都来自网络,AI通过你提供的信息去检索这些库存信息来给你答案,如果找不到就胡乱猜答案。AI没办法去判断  详情 回复 发表于 2025-8-17 19:22
回复

使用道具 举报

98#
发表于 2025-8-17 16:32:24 | 只看该作者
lhc0688 发表于 2025-8-17 06:38
你说的那叫谷歌搜索里面的以图搜图,跟ai识图完全不是一回事。

ai识图说的是理解图像,有专门的模型, ...

那我请你解释下,你给张电影截图给AI,让它分析这是出自哪一部电影,具体是哪一分钟,请问AI给出的答案是怎么得到的?它又是如何肯定答案的?

点评

首先,AI能否用来查找影片资料,答案当然能!目前很多以图识影片的网站、应用,基本都用到AI技术,典型的就是谷歌识图。你可以把图片发给谷歌,然后检索看下。 其次,针对一个已经发布的ai大模型而言,为何你会认  详情 回复 发表于 2025-8-17 18:08
回复

使用道具 举报

97#
发表于 2025-8-17 13:55:41 来自手机 | 只看该作者
豆包生成的图片还是不错的,要合理利用ai
回复

使用道具 举报

96#
发表于 2025-8-17 10:47:23 | 只看该作者
感谢您的分享!
回复

使用道具 举报

95#
发表于 2025-8-17 10:41:20 | 只看该作者
什么都不说吧 发表于 2025-8-17 07:37
ai经常是一本正经地胡说八道,必须要有鉴别能力,不然上当上死人。关键ai的语气,完全它就是专家的样子,一 ...

gpt2刚问世时候,人们评论这种大语言模型的一个特征,就是存在幻觉(会一本正经地胡说八道),这是人类初次接触新一代大模型的一个体验。

往坏处讲:“一本正经”会给人专业的错觉,“胡说八道”又对人产生误导,这是后期模型改进的方面;
往好处讲:“一本正经”会满足指定的风格要求,“胡说八道”又能更大程度体现想象力,这是模型发挥力的方面;

举个例子:让ai画一幅梵高的牡丹图,ai就能”一本正经“地展现出梵高的风格,同时又”胡说八道“画出牡丹;
再比如,让ai生成一段猫咪说话的视频,声音是马老师的,结果你会看到一只猫咪在用马老师的声音”胡说八道“。

这就是大语言模型的一个特征,你不能简单说是坏是好。
回复

使用道具 举报

94#
发表于 2025-8-17 10:28:08 | 只看该作者
同样的问题,ai隔段时间回答不一样
回复

使用道具 举报

93#
发表于 2025-8-17 10:20:13 | 只看该作者
就deepseek解决理科问题确实厉害啊,其它的就像白痴。
回复

使用道具 举报

92#
发表于 2025-8-17 10:14:28 | 只看该作者
窄口牛 发表于 2025-8-17 08:30
你说的行业应用ai,楼主说的是生成式ai,两码事。

你可以叫大语言模型,可以叫生成式ai,可以叫卷积运算,可以叫神经网络,可以叫检查点,可以叫嵌入式,可以叫lora,可以叫文本倒装。。。。,但就是别说分为“行业应用ai与生成式ai”,会让人感觉太外行。
回复

使用道具 举报

91#
发表于 2025-8-17 08:30:27 来自手机 | 只看该作者
lhc0688 发表于 2025-8-17 06:38
你说的那叫谷歌搜索里面的以图搜图,跟ai识图完全不是一回事。

ai识图说的是理解图像,有专门的模型, ...

你说的行业应用ai,楼主说的是生成式ai,两码事。

点评

你可以叫大语言模型,可以叫生成式ai,可以叫卷积运算,可以叫神经网络,可以叫检查点,可以叫嵌入式,可以叫lora,可以叫文本倒装。。。。,但就是别说分为“行业应用ai与生成式ai”,会让人感觉太外行。  详情 回复 发表于 2025-8-17 10:14
回复

使用道具 举报

90#
发表于 2025-8-17 08:00:13 | 只看该作者
☆.。.:*(嘿´Д`嘿).。.:*☆
回复

使用道具 举报

89#
发表于 2025-8-17 07:51:14 | 只看该作者
看了楼上各位的讨论,感觉对AI又有了一层新认识
回复

使用道具 举报

88#
发表于 2025-8-17 07:47:51 | 只看该作者
可以作为参考,但不能以行业标准来要求或者期望得到想要的结果,容易出现偏差。
回复

使用道具 举报

87#
发表于 2025-8-17 07:37:18 | 只看该作者
ai经常是一本正经地胡说八道,必须要有鉴别能力,不然上当上死人。关键ai的语气,完全它就是专家的样子,一般才接触的人特别容易上当。

点评

gpt2刚问世时候,人们评论这种大语言模型的一个特征,就是存在幻觉(会一本正经地胡说八道),这是人类初次接触新一代大模型的一个体验。 往坏处讲:“一本正经”会给人专业的错觉,“胡说八道”又对人产生误导,  详情 回复 发表于 2025-8-17 10:41
回复

使用道具 举报

86#
发表于 2025-8-17 07:26:31 | 只看该作者

从不用这个,只信百度
回复

使用道具 举报

85#
发表于 2025-8-17 07:06:45 | 只看该作者
Flow 发表于 2025-8-16 21:42
现在AI进步确实非常大,但在对问题的解决上,还是和专业的人有差距。

目前的主流大模型在专业领域考试上轻松超越80%以上考生,数学、逻辑、代码等评测准确度可以达到98%以上,这样的成绩有几个专业人士能做到?
回复

使用道具 举报

84#
发表于 2025-8-17 07:01:00 | 只看该作者

恰恰相反,ai模型目前最大的问题就是不能机械化!专业点说就是“解决ai大模型的ID一致性问题”。ai不能像机械一样按程控运行,不能按物理规律保持前后一致,ai过于天马行空,不能像机械一样进行操控。

ai能展现超越人类的想象力,却不能像机械一样受控,这是目前ai大模型攻关的难点。
回复

使用道具 举报

83#
发表于 2025-8-17 06:38:45 | 只看该作者
rrrnnn 发表于 2025-8-16 22:00
你给个图片让AI分析,不过只是识图找答案罢了,答案来自互联网,而且识图也不一定会搜到带有你截图的这张图 ...

你说的那叫谷歌搜索里面的以图搜图,跟ai识图完全不是一回事。

ai识图说的是理解图像,有专门的模型,已经有非常多的应用,叫“根据图片反推提示词”,更强大的还有根据视频反推提示词。
ai识图模型可以实现对图片的理解:人物是什么样的,亚洲人或者黑人,金发还是黑发,盘头还是短发,表情严肃还是在微笑,穿的什么衣服,每件衣服什么颜色,手里拿了什么东西,人物在干什么,背景怎样,图片整体什么风格,是动漫还是人像摄影,油画、赛博朋克、吉普力等等。

能理解图像是ai质的飞跃,也是图像编辑大模型的基础。比如,你可以用如下提示文本让模型编辑图像:把上衣换成红色、让裙子换成短裤、让她拿着手机、把图片风格转为赛博风、背景换成海边、把无关人物清除、等等。

同样,ai也能理解视频,比如在一段视频中找出某个人物、事物出现的位置(可以应用到监控视频检索等),可以修改、替换指定的视频内容,比如换脸,更换视频风格,等等。

ai模型的能力和发展速度远非你们的想象,不要再盲人摸象,拿几十年前的认知来评论自己没用过的东西了。

点评

那我请你解释下,你给张电影截图给AI,让它分析这是出自哪一部电影,具体是哪一分钟,请问AI给出的答案是怎么得到的?它又是如何肯定答案的?  详情 回复 发表于 2025-8-17 16:32
你说的行业应用ai,楼主说的是生成式ai,两码事。  详情 回复 发表于 2025-8-17 08:30
你说的咋叫ai行业应用,楼主说的是生成式ai,两码事。  详情 回复 发表于 2025-8-17 08:28
回复

使用道具 举报

82#
发表于 2025-8-16 22:00:36 | 只看该作者
你给个图片让AI分析,不过只是识图找答案罢了,答案来自互联网,而且识图也不一定会搜到带有你截图的这张图文的电影剧集的介绍,你怎么会认为AI能回答你?他只能找到和你图片相近的文章并提炼出答案。

点评

你说的那叫谷歌搜索里面的以图搜图,跟ai识图完全不是一回事。 ai识图说的是理解图像,有专门的模型,已经有非常多的应用,叫“根据图片反推提示词”,更强大的还有根据视频反推提示词。 ai识图模型可以实现对图  详情 回复 发表于 2025-8-17 06:38
回复

使用道具 举报

81#
发表于 2025-8-16 21:42:23 | 只看该作者
现在AI进步确实非常大,但在对问题的解决上,还是和专业的人有差距。

点评

目前的主流大模型在专业领域考试上轻松超越80%以上考生,数学、逻辑、代码等评测准确度可以达到98%以上,这样的成绩有几个专业人士能做到?  详情 回复 发表于 2025-8-17 07:06
回复

使用道具 举报

80#
发表于 2025-8-16 21:05:19 | 只看该作者
漂亮国几大科技巨头投资5千亿美金买显卡建算力中心,就为了不被抛下AI赛道,meta花4亿美金挖一个AI工程师,英伟达市值超两万亿。。。。

再看咱们这个曾经IT界大名鼎鼎的无忧启动论坛,现在已经没落到何等地步。看看论坛里那些莫名其妙、不知所云的发帖,老气横秋、自以为是的争论,但凡有点脑子都不会如此,毕竟好赖也是一群混IT论坛的人。
回复

使用道具 举报

79#
发表于 2025-8-16 19:47:33 | 只看该作者
AI太机械化了

点评

恰恰相反,ai模型目前最大的问题就是不能机械化!专业点说就是“解决ai大模型的ID一致性问题”。ai不能像机械一样按程控运行,不能按物理规律保持前后一致,ai过于天马行空,不能像机械一样进行操控。 ai能展现超  详情 回复 发表于 2025-8-17 07:01
回复

使用道具 举报

78#
发表于 2025-8-16 19:33:50 | 只看该作者
2013taburise 发表于 2025-8-16 19:32
AI的原理其实可以理解成高级的“输入法联想”,就是根据训练语料的概率,计算一大堆语言素材之后,下一个文 ...

比如我现在给公司做点简单的二次开发,已经可以直接把需求扔给AI,让AI自己写代码了,写的不对就把问题告诉AI让AI重写就行,多一半可用
回复

使用道具 举报

77#
发表于 2025-8-16 19:32:35 | 只看该作者
AI的原理其实可以理解成高级的“输入法联想”,就是根据训练语料的概率,计算一大堆语言素材之后,下一个文字出现的概率,所以你问这种即时信息百分百是错的,你要是问某种编程语言的问题,或者让它模仿谁的风格写个散文还算有可能
回复

使用道具 举报

76#
发表于 2025-8-16 19:10:39 | 只看该作者
本帖最后由 lhc0688 于 2025-8-18 15:49 编辑

发个用AI编辑图片的小例子.
回复

使用道具 举报

75#
发表于 2025-8-16 18:13:50 | 只看该作者
本帖最后由 lhc0688 于 2025-8-16 19:27 编辑

AI玩的就是幻觉,说得文雅点就是想象力。比如你要让它画一幅画、做一首曲,这就需要AI有幻觉才行,不然它只会原版照抄(术语叫过拟合);

AI模型也需要专业对口,比如写代码的、数学运算的、处理图像的、视频的、声音的、或者某个专业医学领域的,你需要找对口的模型用才行;

说AI是数据检索,两年前gpt刚推出时候这样说还有情可原,毕竟刚开始很多人不太理解,现在AI已经无处不在,已经大量参与到各种科技、生产力、生活之中,包括高精尖的无人驾驶飞控格斗,包括大量图像、视频、音频创作、编辑等等领域。就举一个小例子:两年前电商拍商品展示的模特月入百万,现在大多已经无人问津了。再比如两年前印度人凭着程序代工,在科技大公司大行其道,硅谷几大巨头几乎都被其包揽,现在却让位给华人,现在已是算法为王。

AI能玩、好玩的东西太多了,别在抱残守旧、不懂瞎评论了,换台好点的电脑,实际去玩下,你会发现一片奇妙无比的新世界。


回复

使用道具 举报

74#
发表于 2025-8-16 17:28:28 来自手机 | 只看该作者
绝对意味终结
回复

使用道具 举报

73#
发表于 2025-6-30 21:50:33 | 只看该作者
本帖最后由 cjfcjf111 于 2025-6-30 21:51 编辑

哈,问路好象还是导航软件好一点吧,问电影,这个是很模糊的事,你真以为AI是个什么神仙,还能每幅画面都记的住,AI是个能自学习的东西,问的多了,有的问的人会去纠正,AI就会作个调整,只是这样而已,而且AI中的学习方式也有好差区别,否则天下AI不是一样了,国内的AI本就是世界上最差最垃圾的AI,你还想要最正确的答案,还用豆包,豆包算个什么AI,世界上有没有排的上名次的AI也不知道
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|捐助支持|无忧启动 ( 闽ICP备05002490号-1 )

闽公网安备 35020302032614号

GMT+8, 2025-11-12 00:33

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表