2024.09.26.翻译机器人(智能的核心)¶
今天的课呢,在开始之前呢,我们先回顾一下昨天的作业。那昨天呢,我就跟大家说,你可以去研究一下ChatGPT在各个客户端之间的区别。它有很多访问方式,你手机上呢有一个客户端手机版,Mobile version,比如说iOS或者是这个Android。然后呢,现在你还有桌面端,桌面端呢也有Desktop Application,对吧?然后呢,你也可以用浏览器访问它的Web端,对吧?所以一共有三个端,就是移动客户端、桌面客户端和网络端,对啊,网络客户端。
接下来呢,其实就是我们在思考的真相里所说的一个思考框架,叫什么呢?定义、分类、比较、因果的一个实际应用案例,对吧?你看,我们现在定义得很清楚,我们的问题是要研究ChatGPT各个客户端之间的区别,对吧?然后紧接下来呢,就变成分类了,对吧?你看现在有三个端啊,客户端、移动端和桌面端,对吧?然后呢,其实还有另外一个分类,就是它的功能在各个端上是怎么实现的,对吧?所以呢,那其实你把这两个分类拿出来呢,就可以做一个表格。请注意啊,这种思考方式,注意我们在解决问题的时候脑子里的思考方式,这才是关键,知道吧?
那么你就看到了哈,我经过一段时间的比较分析,然后呢,就看出来了各个功能在各个端当中不一样的地方。于是呢,我稍微罗列了一下,这其实是一种分类。于是呢,我现在哈,这个功能上主要想要比较的就有差不多十来个分类,然后呢,端呢有三个已有的分类,然后呢,就可以做一个表格。那我现在呢是先这样哈罗列了出来,那过去的话呢,我当然会打开Excel表,对吧?然后呢,这个这个打开Excel或者是Google的Spreadsheet,然后呢去做一个表格,对吧?
然后呢,这个这个现在呢不一样啊,现在呢我们有这个这个ChatGPT啊,那干嘛不用啊,对吧?所以呢,我就跟ChatGPT说,做一个表格,比较一下ChatGPT各个客户端的功能实现情况。然后呢,我就把刚才我整理的那个哈,列就是功能啊都有哪些,然后呢,这个行就是各个端都有哪些啊,发给了他。很快,真的是很快,他就返回来了一个表格啊,只不过这个表格呢是Markdown的表格啊。当然了,Markdown的表格对我来讲是更好的,因为我写文章的时候啊,写教程的时候啊,其实都是用啊这个Markdown编辑器的,对啊。
OK,所以呢,他就给我了一个Markdown表格。然后呢,我看了一眼就会发现,说他多少有点胡说八道,和我的实际调查情况并不一样。不过呢,我并不着急,反正我一会儿要改,只不过我觉得说哈,那里面写的支持不支持看起来很难看,所以就进一步的要求他说,请你用unicode的对号表示支持,用错号表示不支持。然后他就返回了另外一个这个Markdown啊,用对号和错号啊去这个替代了汉字的支持和不支持,对吧?
然后呢,我看了一眼啊,他用的那个符号很难看,对吧?那我就进一步跟他说,那请用黑白符号吧,对吧?OK,他就给了我另外一个这个表格啊,然后呢,用黑与白,黑白符号来表示支持不支持。整个聊天过程呢,大家可以在这个链接里看到。然后呢,我就得到了一个这样的表格。那这个表格呢肯定是不对的,有很多地方他没考虑到的,或者他干脆就是在胡说八道,煞有其事的这个胡说八道,对吧?那没有关系,反正他表格给我了,然后呢,我自己也研究了,然后现在呢,我就把它拷贝粘贴到我的Markdown编辑器里面呢,我就可以哈去修改了,对吧?
好了,你看,我们分类了,然后比较了,然后呢,一会就会带出因果的,对啊。那我们大致看一下哈,GPT的功能在移动端是不能访问的,在桌面客户端也不能访问的,然后呢,在这个外部端呢,当然是可以创建这个Customer GPT,对吧?然后呢,聊天搜索功能呢啊,移动端都有,桌面端没有,都有,对啊,但是呢,这个外部端竟然没有,对吧?外部端没有的另外一个是什么呢?就是语音聊天,对吧?桌面端当然也没有。所以大家就一目了然哈,就这个功能是这个这个比较之后是一目了然的,就是功能实现最全的当然是外部端,对吧?
所以呢,结论就很清楚嘛,就是我们怎么用ChatGPT更好呢,对吧?怎么用最好呢?这不就是工具使用方法论当中我们要问自己的问题吗?三个问题,最基础的是怎么用,第二是进阶的思考怎么用更好,对吧?然后呢,再去研究,然后再去研究怎么用最好,对吧?这不就是初级、中级、高级吗,对吧?OK,那么可以一目了然地知道说,哎,其实呢,是用外部端更好的,对吧?这不是很简单的事情吗,对吧?
所以呢,我可以告诉你的是哈,使用任何工具迅速成为专家,其实你看这个过程啊,这背后的思考过程其实是非常简单的。但为什么99%的人不行呢?第一很简单,他没有这个习惯;第二,他甚至不知道应该这么思考。然后呢,这种东西太过基础了,乃至于说学校里都不教,老师也不教,大家都假定你会,结果呢,大家都不会,对吧?所以如果你是父母,你真要教你家孩子的是这种东西,因为是这种背后的思考能力才会带来真正的创造,而不是给他创造的结果,那么他永远只能看到结果,最终长成99%的人那个样子。
好了,让我们接着往下说。其实呢,这你就明白了,如果哈你想用ChatGPT,对吧?那么呃,99%的人都用的是什么呀?ChatGPT的客户端,iOS,iOS下面有APP,他就下载那个APP,他就那么用了,到现在他就一直这么用。但是你不一样,你会思考,对吧?甚至呢,你会让ChatGPT帮你干活,对吧?然后呢,你就做了个这样的表格,然后呢,你现在的结论就非常非常清楚,即便是在手机上,其实也应该用手机里的浏览器去访问ChatGPT点com。
当然了,无论是iOS还是安卓,都是可以在桌面上创建网页的快捷方式的。所以呢,即便是在手机上,我也是这样访问ChatGPT的。大家看了,其实是我打开了浏览器,然后呢,浏览器输入ChatGPT点com,然后呢,访问这个ChatGPT,对吧?然后可以用的功能呢,就比手机客户端稍微多一点。唯一的这个这个这个叫谁啊,不足就是没有手机客户端上的那个语音聊天,对吧?那没有关系啊,当我需要语音聊天的时候,我就打开那个客户端就可以了嘛。
好了,你看啊,分类之后就可以比较,比较之后呢,就可以有因果,对吧?那这不就是因果吗?为什么我在手机上一定要用浏览器去访问ChatGPT点com?你看,这不就是前面啊分类比较带来的结果吗?这是个决策,对吧?好了,我们再来看看哈,我们在这个电脑上,在电脑上呢也有客户端,但是比较来比较去呢,发现用电脑上的客户端不划算,对吧?还是应该用Web客户端,对吧?那Web客户端怎么办呢?嗯,那就打开浏览器用嘛。
然后呢,有两个功能,对啊,一个是聊天搜索,Web端没有;另外一个是语音功能,这个这个呃,Web端没有,当然桌面端也没有,对啊。那有没有什么办法进行补充呢?有啊,对吧?那你比如说,我用这个macOS啊,系统默认的浏览器是Safari,对啊,然后这个Safari呢,嗯,扩展插件比较少,对吧?那怎么办?那我就用比如说Google Chrome或者是Firefox都可以,对吧?啊,然后呢,去找一个浏览器带插件的。
好了,那作业就又来了啊,就是你可以自己去找一找嘛,看看Chrome浏览器插件,对啊,有哪些插件可以弥补不足呢?甚至可以增强体验呢?啊,比如说哈,聊天搜索插件一定有的,你搜一定有的啊,Chat History啊,Chat Search,对啊,你搜一定有的。那么也就是说,你在呃原本不动的情况下啊,你用ChatGPT的网页端是没有聊天搜索功能的,但是你用一个带有插件的,比如说浏览器,比如说啊,Google Chrome啊,Firefox也有插件的啊,那么你找一个这样的浏览器,然后去搜索插件,一安装那个插件之后呢,你就可以搜索聊天了。
甚至呢,连语音聊天功能插件,我猜你也找得到的,我猜你也找得到的。那我自己呢,找了一个这个插件,这个插件干嘛的呢?就是在Web的端啊,呃,用enter就是回车键啊,发消息是特别烦人的一件事情。为什么呢?因为我我们在跟ChatGPT聊天的时候啊,呃,我们输入的内容可能会比较多,对吧?所以呢,我希望他是command enter发消息,而我直接敲enter的时候呢,他应该只是换行。
当然,在ChatGPT的Web端默认设置下,enter是发消息,shift enter是这个换行,对吧?那就容易产生误操作嘛。于是呢,我去搜了一下,那果然有啊,有这样的插件。至于是什么样插件,你也可以自己去搜一下,对吧?这不是作业吗,对不对?然后呢,我就可以在这个浏览器里啊,访问ChatGPT的时候,那输入消息的时候啊,用enter换行,然后输入很多消息,我在那里任意编辑,然后呢,确定检查完毕之后呢,我才按command enter,然后呢,把它发出去,对吧?哎,这样就增强了使用体验。
另外一个呢,是这样的啊,经过一段时间的使用呢,我会觉得说,其实呢,我应该给ChatGPT.com这个网址找一个专用浏览器,对啊。我在日常生活当中呢,是不用这个系统自带的Safari,因为它有点有点有点这个这个钝,对啊,我的意思是说不够灵活啊,虽然呢它也很快。所以呢,我平日里呢是用这个这个Google Chrome的,对啊。那么我现在呢,如果也在这里啊添加很多ChatGPT专用插件,然后呢,这个这个呃,访问ChatGPT有两个问题,一个问题是插件太多,浏览器就跑得吃力,这是另外一个一个问题。
另外一个问题是什么呢?就是呃,我经常会不小心哈把浏览器关掉,对吧?那怎么办啊?那么我就用另外一个浏览器啊,当做访问ChatGPT的专门浏览器,专用浏览器。比如说我可以用Firefox,反正呢,Google Chrome的那些插件在Firefox里也可以通用,对吧?当然了,我也可以用一个定制的这个Google Chrome,有另外一个浏览器叫Brave,对吧?啊,Brave browser,那么它呢相当于说是这个这个基于Chrome内核哈做的一个浏览器,对啊。
好了,那我随便用哪个都可以,我用这个浏览器作为访问ChatGPT的专用浏览器。反正呢,这个浏览器是很多的哈,还有什么Opera什么都行,反正总而言之,你去找一个你觉得用着顺手的啊,看着舒服的浏览器,作为ChatGPT.com的专用浏览器,然后把它的首页呢,直接设置成这个这个ChatGPT.com。所以你打开这个浏览器,直接就去访问那个网页去了,对吧?然后呢,它就有很多的好处,对吧?可以添加很多插件,然后呢,增强啊这个这个这个ChatGPT.com的使用体验。
与此同时啊,你又多了一个功能,就是多标签聊天,对吧?你可以打开很多个标签放在那里,访问就很方便,对吧?比如说,你可以打开一个事实审核员机器人标签,对吧?然后呢,你在另外一个标签里正常聊天,你可以edge这个机器人,你也可以直接哈点那个标签进去,跟这个事实审核员多说几句。好了,到此为止,在ChatGPT的使用上,你已经成了至少是1%的人,弄不好是千分之一的人。
因为你知道的,在日常生活当中,人们对工具的重视程度其实远不如你以为的那么高,对吧?你去看看,所有的工具都是一样的。那同样是花钱买来的同样价钱的电脑,对吧?那在每个人手中为啥就不一样呢,对吧?那同样价钱买来的同样的软件,比如说Excel,对吧?真的会那么多公式可以在日常生活当中熟练使用的人有多少呢,对吧?同样是PowerPoint,对吧?你见过几个人哈用得炉火纯青呢?所以呢,其实仅仅到此为止,你可能就已经PK掉了啊99%的人,真的一点都不夸张。
更何况,我们接下来还会有更多的基础手段,会让你一定必然PK掉99%的人。在这个世界上啊,PK掉99%的人是非常容易的。然而呢,到此为止的内容啊,对你更为重要的并非是如何使用ChatGPT最好,因为我们刚才讲的只是客户端的选择以及设置,它只是一个基础内容。虽然这样的一个基础内容也能PK掉99%,但是对你来说,这个不是最重要的,最重要的是在这个背后,你的工具使用原则啊,工具方法论的进一步提升和一次的实践,对啊。
然后呢,你也看到了哈,我们那个小车子小课啊,分类、比较、因果,其实呢在生活当中任何一个地方,尤其是关键的地方,尤为有用。好了,这个呢是昨天我们留的作业啊,引发出来的一个讨论,并且呢啊引发出来的一个实践,以及一次进阶。那么我们今天呢,顺着昨天的重要话题再讲下去。昨天的时候呢,我们知道了一个东西叫什么呢?叫AI幻觉,对吧?就artificial intelligence的这个这个这个叫叫AI hallucinations,对吧?
那么AI幻觉,然后呢,我们知道了如何去应对这个AI可能产生的幻觉。那刚才呢,我们也看到了一次哈AI幻觉的实例啊,我让他做一个比较,对吧?他根本就没做比较,他只做了一些最基础的比较是对的,然后剩下一半左右是错的,对吧?还是得靠我们自己的大脑去做逻辑判断,对吧?但是呢,他毕竟很快的帮我哈写了一个这个这个Markdown表格,你知道那个我手动做还是费时间的,对吧?他还是帮我干了很多活的,对吧?节省了很多时间的。
然后呢,我在运用我的思考,哎,把它搞定了,对吧?然后呢,嗯,他这就是一个AI幻觉的实例嘛,我们也看到了。但是昨天呢,我们解决了这个问题,对吧?那么我们通过设置一个fact checker啊,事实审核员的机器人啊,或者叫做customized GPT,一个在移动端和桌面端都无法访问的高级功能!只有在Web端可以访问的高级功能里面,我们设置了一个机器人,对吧?瞬间你就高级了啊,为什么呀?你想想看,那么多用客户端的人,根本就不知道有这个功能,对吧?
那昨天呢啊,我们也跟大家讲了哈分类思考的方法,那你罗列一大堆之后呢,尽可能的分类,然后最终呢,你要做粗暴分类或者是终极分类,叫什么呢?要么是二分法,要么是三分法。所以呢,我罗列了一堆的局限之后呢,嗯,我就这么分类的,就是OpenAI可以解决的,或者至少他自己可以不断改善的,对吧?那那些什么训练数据落后啊,网络搜索能力差啊,缺乏逻辑思维啊,逻辑推理能力啊,这都是OpenAI可以慢慢慢慢解决的。
然后他不能解决的,其实呢,我又可以两分,就是我没办法的,和我有办法的,对吧?比如说AI幻觉,那我就有办法呀。所以呢,很快我们就创建了一个AI机器人啊,然后叫customized GPT,对啊,呃,然后呢,这个叫事实审核员。那我当时归位在没办法的里面有两个,对啊,昨天我没来得及讲,这对吧?那我们今天呢,就深入讲下去,哪两个呢?第一个呢是语言局限,而另外一个呢叫隐含偏见,对吧?
那我们先讲语言局限,对吧?那语言局限指的是什么呢?是这样子的,你要明白一个道理,就是AI这个东西啊,目前来看,AI的母语是英语。这个语言局限呢,嗯,首先看这个人工智能自己的发展哈,就是AI的母语是英语,这是没有办法的事情。为什么呢?这背后有一个更令人无奈的、令全世界其他语言的使用者无奈的事实是什么呢?就是从今天的事实结果来看,科学的母语就是英语。
曾经不是啊,曾经科学的这个这个母语可能是希腊文、拉丁文,但是后来呢就变了,现代科学的母语啊,现代科学的母语就是英文,全世界所有科学知识目前都是用英文记录的。所以呢,这变成了完全没有办法的事情,对吧?没有办法解决,不需要解决,对吧?嗯,地球上很多其他语言的国家也在尝试创造自己的AI,对吧?但是没有办法的,训练数据最终95%以上都是英语的,英语的,尤其是对我们真正有用的内容,即科学内容。
当然,你要非要跟我争辩说哈,科学不是最重要的,那我也没办法,对啊。但是如果你认同哈科学内容最重要,然后呢,你也知道接受这么一个事实,或者知道这么一个事实,科学的母语目前,现代科学的母语目前来看它就是英语,那么你也能理解为什么AI的母语它就是英语。于是呢,接下来会出现一个很现实的情况,什么呢?就是同样的问题,你用英语问ChatGPT获得的答案质量,和你用中文去问ChatGPT获得的答案质量,它不一样。
我给你举一个啊,我们已经经历过的例子。其实呢,你在ChatGPT里去问啊类似的问题,用英文问的话,是很少出现AI幻觉的。就比如说昨天我们的房祖明啊、梁家辉、曾江三个人共同出演的电影是什么,就马上产生了AI幻觉,对吧?一本正经的、煞有其事的胡说八道,对吧?但是类似的问题啊,如果你在英语的世界,就是你在用英语去问这个这个这个这个啊ChatGPT的话,那么这个幻觉基本上早就被OpenAI解决掉了。
就类似的问题啊,比如说我去问ChatGPT啊,用英文去问,布鲁斯·威利斯啊,还有这个啊,Bob Thompson和Kate Blanchett共同出演的电影是哪个啊,那么他马上就会给我正确的答案,对吧,对吧?然后呢,这个这个啊,我再用这个Fact Checker去验证一下,果然答案是正确的。所以呢,这是一个很现实的局限哈,就是英文是AI的母语,然后而我们的母语不是英文。
然后当然还有很多理由哈,为什么你用英文去问ChatGPT会获得更高质量的回答,很多很多其他原因了,在这里呢就不展开了,因为这个翻译本身就是很困难的事情,然后还有大量的词在英文世界里存在,在中文世界里其实并不存在,对吧?就算存在也是硬翻的,所以呢,其实啊不一定能够表达那个意思,等等等等吧,对吧?然后呢,嗯,如果你有兴趣的话呢啊,你也会去了解,你可以去了解一下,就是与多种语言之间的理解障碍啊,是多么的不可逾越。
你也可以去了解一下哈,历史上有多少因为语言误解而造成的灾难,对吧?我给你个prompt,对吧?你自己去问问ChatGPT也可以的,你让他list as many as possible disasters caused by misunderstanding among different languages,be accurate,factual,along with credible sources or even better verified and valid links。就这么一个这个这个prompt,你可以试试,对吧?啊,你如果是不懂英文的话没有关系,你可以把这个prompt翻成中文,同样去问啊,得到的答案质量可能稍微差一点。
prompt翻成中文同样去问,当然了,得到的答案质量可能稍微差一点。然后呢,你看到每一条,你都可以继续去查一查,或者是起码用事实审核员去这个审核一下那个事实是否准确,对吧?OK,所以呢,就是结论上是这样子,不管我们证明起来多么麻烦,或者你理解起来多么麻烦,有一点是确定的,就是AI的母语是英文,然后呢,你用英文向他提问题获得的答案质量往往相对更高,叠加起来之后的效果差别很大。
然后呢,问题在于说,你是和我一样,母语并非英文,那怎么办?这个呢,在昨天我们还被列为是暂时无法解决的问题。但是我们想想办法可不可以呢?可以的。那么如果我们挣扎着进一步思考的话呢,其实还是有办法解决,两种方式嘛,一种呢叫及时解决方案,就是马上解决的