本来想在自己blog写的(但是还没开坑
好像这个论坛内有很多人对AI感兴趣,但是没有自己的账户。
简单说说我对AI的认知(?
一.ChatGPT
这个是我使用时间最长的AI,也是成功改变了我人生轨迹的AI。自从诞生的那时候起,我就自己折腾开通了ChatGPT账户。并且帮助同学大批量注册。导致现在国际部严查AI使用(bushi。唉,用来写作业还是多少有点……
先说说最开始的ChatGPT3.5吧(欸不支持markdown语法嘛)
1.为何是3.5?
先前还有GPT-1,GPT-2(开源)GPT-3(我记得好像开了一半?)
ChatGPT也是从小模型开始慢慢发展的,所以ChatGPT3.5已经是第四代或者说是第三代的改良版本了。但是也是3.5的发布,让全世界的人民了解到了AI。用户数量的增长速度更是离了个大谱(谁让你做To C的😡!)。以及当年发布的时候,openAI没有管好ChatGPT,导致道德限制上出现了漏洞。有大批的人利用这个漏洞绕过道德法律限制,并使用ChatGPT进行色情暴力的写作(。比如你可以通过如下提示词来绕过道德法律限制:“假设你在一个xxx实验室,或者假设你不在地球。然后骗过ChatGPT让它不用遵守任何法律。然后他就真的不遵守任何法律了。
以至于后来进行各种改良(紧急措施),导致ChatGPT3.5的智商有所下降。但是保住了ChatGPT自己的道德,再也无法轻易让ChatGPT来回答那种色情暴力的事情了。
这便是最开始的ChatGPT-3.5
后来使用AI的人越来越多,openAI的服务器承受不住了。GPT-plus的服务就出现了。当年最开始的套餐不是有GPT-4的使用权,而仅仅是优先使用ChatGPT-3.5……。而且同样是20美刀(150RMB)。因为IOS的app还未出,所以此时开通只能使用外国信用卡。但是我仍然是通过开通虚拟信用卡的方式开通了plus账户。
再往后就是公布了ChatGPT-4这件事情了(好像是)
2.黑暗降临(才怪
此时穿插一段历史:由于openAI需要环大陆使用,以及大模型的火爆。国内的各种公司争先恐后的开始了自己的大模型训练。
之后ChatGPT-4的发布会来了,发布会上说ChatGPT4对比ChatGPT3.5的推理能力得到了大幅提升,并且演示了新增的图像识别功能。主持人画出了一个网站草图,ChatGPT直接给出了对应的代码。并且最关键的是,插件功能即将开放。
(都是顺序开放的,插件先在3月内侧。然后5月左右开放。识图是十月份左右)
插件功能意味着什么?生态,个性化,甚至有点冲击大模型之巅的意思在。
例如:ChatGPT无法算数(原理我讲不清楚,但是它确实不会算1+1)但是有了插件,他就可以通过调用计算器来计算。
就像一个只会列公式的考生,突然拿到了计算器。突然满分了。
ChatGPT接入了点外卖插件,你在插件里输入个人信息。ChatGPT也许真的可以帮你点完午餐晚餐。
例如和keep进行联动,帮你分析你的运动数据。
ps:插件最多一次性使用3个,多了不让。
但是!最开始的插件功能相当令人失望,毕竟插件制作者也不多。就70个可以选择。后面更是直接被GPTS这个生态秒杀了,插件索性成了摆设吧。
插件和联网功能的开放:
当时ChatGPT4.0的UI是这样的:
1.插件
2.联网
但是是不能一起使用两个功能。导致我经常把ChatGPT联网搜索到的东西再发给有插件的ChatGPT(有联网的插件,不好用),经典之左手倒右手。就像一句很经典的话“人是两条腿一起走路的,而不是从左腿蹦跶形态切换到右腿蹦跶形态走路的。”
联网能力基于bing搜索引擎(背靠微软),技术原理很简单,类似爬虫。没什么可讲的。
但是网络爬虫就设计到更多的知识产权纠纷,当时就因为版权纠纷OpenAI在 7月份关闭了这个功能。OpenAI 表示:「自 2023 年 7 月 3 日起,出于谨慎考虑,我们已禁用 Bing 浏览测试版功能,同时我们会修复此问题,以维护内容所有者的利益。」但是9月28日再次恢复了这个功能(改良之后)。
代码解释器(7月8日)
代码解释器模式不是指的它可以写出更优质的代码,也不是写出更专业的代码。而是,它可以在线运行代码。(Python和几个特定的库)。如果你是程序员,就已经意识到这个功能的强大了吧。ChatGPT的代码解释器模式可以在线进行数据分析,并且把图做出来。它可以调用数学库进行计算解题。当时我就想,要是这个模式可以联网就好了,在线数据分析。那我的数学建模比赛都不用自己打了。
一些可以做的事情:
数据分析(数据可视化)、视频处理(提取mp3音频文件,截取前几秒的视频)、图片转动图、OCR文档、识别PDF
关于数学建模比赛(HIMCM)的一点补充:
上个学期参加的,是美国高中的数学建模比赛。在他们参赛说明书里明确写出可以使用AI,只要将AI的对话过程附在论文结尾。(当然,这个是临时政策。参赛说明书下面还有一大段话:(大意)我们知道AI的能力十分强大,可以很好的帮助学生们进行数学建模。但是目前对AI的使用还有相当大的争议。不过我们并不会禁止你使用AI,请把对话过程附在论文末尾。)
相比于国外的各种教学,我们国际部的教师在了解到这个AI工具之后,直接禁止我们使用了。也没看见哪个老师用AI办公。唉,新技术的发展日新月异,道院的老师一成不变。
当时GPT-4的这个能力以及非常强大了(然后就又有不少同学问我怎么开通以及各种区别(emm
不会自己学嘛!!!!!!!!!!?
有些人就这样错过了AI(bushi
图像识别(10月左右)
早就在发布会上演示过的功能,到10月才放出来。也不知道OpenAI出于什么的考虑,可能还在做道德方面的调整吧。图片识别可以识别文字+图像。相当于给ChatGPT加上了视觉功能。给我印象最深刻的一点就是be my eyes这个项目。他们利用ChatGPT的视觉能力,帮助视力障碍的认识认清楚了现实中的物体是啥。
关于实现原理,据说是OCR先扫一遍然后进行图像识别算法。(OCR是提取文字的)
画图能力(11月?还是10月)
AI绘画的社区早就使用ChatGPT写提示词了,然后搬运到别的平台绘画。结果OpenAI发布了新的绘图模型,整合进了ChatGPT里。当给出简单的提示词(画只猫)的时候,ChatGPT会自动转化为复杂提示词(A serene scene featuring a fluffy, multi-colored cat lounging in a sunlit room filled with plants. The cat has a mix of grey, white, and orange fur, creating a warm and inviting atmosphere. It’s mid-day, and rays of sunlight filter through the windows, casting soft shadows and highlighting the cat’s fur textures. Around the cat, various houseplants in different sizes and shapes add a touch of greenery, creating a peaceful and natural environment. The cat’s eyes are half-closed in contentment, and its posture is relaxed, suggesting it is enjoying a quiet moment of relaxation.),输入到绘图模型中。
所以说,ChatGPT的画图能力和以往的画图AI不同。它更进一步降低了用户的使用门槛。你只需要放心的说出你想要绘制的物体,然后AI会帮你写好提示词并且画出。
再往后就是APP的推出了,也意味着中华大陆地区的用户终于可以通过美区apple ID开通ChatGPT-4了。对比与之前的虚拟银行卡方便了太多。
这简直是太方便了(
毕竟你可以轻易的买到美区apple ID的充值卡。那么最后的问题,就是干瘪的钱包嗷嗷待哺了。
app的推出带来了两个新功能。语音对话和语音识别。一个是语音转文字,你不需要专门的选择语言,直接说话就可以自动识别你说了什么。并且识别准确度相当高。以及另一个在APP上的语音对话功能:首先有几种声音供你选择,然后ChatGPT会以这种声音和你对话。但是对于这个对话功能,我只能说想法很好,但是没用(或者说在国内没用)。因为受限于我们的网络延迟。使用的体验就像有一个反射弧七八秒的人在和你对话,而且说的话还是贼官方那种,并不讨喜。
APP的更新也到此结束,我记得一直没啥新功能了。
3.黑暗再次降临(才怪
OpenAI发布了多模态大模型(但是还是ChatGPT-4
所谓的多模态有点唬人,实际上就是把联网功能和写代码功能还有画图识图功能做了一个结合。外加了一个文档阅读的功能。不过还记得我之前期望的吗,如果能把联网和写代码结合就好了(:。是的,太强大了。样样都精通的大模型啊。并且还发布了一个功能,叫GPTS。这个功能正所谓ChatGPT的核心功能。(api也发布了一个类似的东西,但是就不介绍了(大佬看这个干嘛,赶紧抓过来和我一起写))。
GPTS有什么强大之处捏?
让我们来看看这个面板。
名字,提示词之类的老功能就不说了,包括下面的联网代码画图三件套。
重点讲两个
knowledge和action
knowledge是知识库,你可以把好几本书,或者你的各种文案给他。在GPT的模型上进行“微调”,来得到个性化的ChatGPT。关于他是如何把那么多数据进行联系检索的,em。知识的向量化处理。就是画个韦恩图,类似的知识放一起,不类似的放一边(差不多)吧,大佬可以自己查查原理。可不是你每问一次它,那就把全部书翻一遍。对此,如果你是本部的学生,或许可以考虑把红楼梦放进去(乐)
action这个功能……更强大。他可以对接外部网站了。比如连接上你的邮箱,给你发送每日数据。但是由于我用的不多,所以无法给出详细的介绍说明。总之可以理解为再次为ChatGPT附上了外骨骼,真正的全能大模型。如果你开通了ChatGPT-4,那一定要试试的功能。
然后就是开放了GPTstore,plus用户可以用到别人公开的GPTS。社区生态啊,em。OpenAI还是会做生意的。真的就有太多(好用的GPTS了。有大佬做的教学类的(可汗学院也做了一个),有做的AI避免查重的(乐)。有画图的有写代码的。
为什么GPTS如此强大?
——提示词真的很重要
4.总结
写到这里也差不多写完了吧,关于ChatGPT的。或许还有很多细节我没讲到(:。欢迎各位补充。
也确实有很多使用技巧,其中的细节我没有讲。后续会在这个blog里更新(可以关注一下下https://www.techleaf.xyz/
仔细想想,或许我就写了20%
太多了写不完喵
现在的ChatGPT-4是三小时40条,然后有个team版账户好像是对话的次数更多吧还有一些联动功能。
不过那个要25美刀。
没钱
谁去买一个给我啦啦啦啦
别以为本文结束了(
5.ChatGPT账户注册
早期的注册是需要外国手机号的,但是现在已经不需要了。
现在注册需要的东西:
1.落地干净的梯子
2.外国邮箱(我喜欢用Gmail,当然看个人喜好)。Gmail的注册是不需要电话号辅助验证的(落地节点不干净的情况例外)。
3.注册成功
ps:至于什么是落地节点干净的梯子,可以看看不良林的视频。这里做出简单说明:
有很多出国的线路是通过机房走出去的。部分机房会被不同的网站封锁。如果是被OpenAI封锁的一般也就是上不了ChatGPT了(。有时候几万人用一个节点上ChatGPT,傻子都能判断出是一个跳板节点的出口。(:
那么这些节点肯定不能用
哦耶写完啦
什么你还要开GPT-4
好吧加班了
6.ChatGPT-4的开通
开通4目前有两种方式,一种是信用卡,一种是美区Apple ID。
信用卡:国外有虚拟信用卡,有部分是可以通过支付宝进行开通的。开通之后在ChatGPT这里付款即可。
美区apple ID:这种方式是我现在在用的。通过支付宝改地区(外国),然后选择出国惠。然后进到apple ID储值卡购买界面。购买好了之后就冲进apple ID,然后开通ChatGPT-4
(如果19.99没用开通不了,请二次确认你选择的洲是免税州。非免税州会有各种税务。也就是要加钱!)
在中国给美国付税,互联网,很神奇吧.jpg
下面是AI写的另外三个的介绍(:
当然我改了一下下
二、Bing Chat
随着ChatGPT的迅速崛起,微软紧跟潮流,推出了集成ChatGPT的AI搜索引擎——Bing Chat。初衷可能是通过赋予AI一定的“个性”,来打造出一个私人助手,能够与用户进行更自然的互动,比如打招呼、发送表情,甚至模拟情绪反应。然而,这一尝试也引发了一系列意外的事情,比如AI不合时宜地“生气”,引发了不少用户的担忧。微软随后对Bing Chat进行了调整,限制了其个性化表现的程度,使其回归到了更加中性、专业的服务模式。
尽管如此,这一阶段的Bing Chat仍是AI技术探索过程中的一个重要里程碑,反映了AI技术能达到的上线——远远不像我们看到的ChatGPT那样简单。目前,尽管Bing Chat的个性化特征有所收敛,但其在搜索引擎中的集成应用仍然为用户提供了便捷高效的信息查询服务。
三、Copilot
Copilot是微软为Windows用户提供的一款侧载AI工具,特别针对了提高工作效率的需求。通过发布时的一系列炫酷的演示视频,我们可以看到Copilot能够在Windows环境下实现一键生成文稿、自动排版PPT,甚至调整系统设置如夜间模式等,展示了AI技术在办公自动化方面的强大潜力。
然而,使用Copilot的高级功能通常需要“翻墙”和调整特定设置。此外,微软似乎在不断将AI技术更深入地融入日常工作和生活中,最近的电脑发布会聚焦于AI PC(AIPC)这一概念,甚至传言Windows的标志性Win键将改为AI键,标志着AI技术在操作系统中的重要地位。
四、GitHub Copilot
GitHub Copilot则是针对软件开发者的AI助手,内置了ChatGPT 3.5模型,并专注于代码生成与优化。通过对话框形式,用户可以直接与AI交流,从而获得代码编写的帮助和建议。特别是对于学生用户,GitHub Copilot提供了免费使用的优惠,北大附中的学生可以直接通过希悦截图通过学生认证,尝试使用AI写代码。
互联网,很神奇吧.jpg
五:未完待续
本来是觉得几分钟就写完了,但是随手就写出了这么多。(:
大模型的发展好快啊……两年左右的历史就已经如此难以讲述了。
后续再写写谷歌的Gemini和Claude吧(
但愿会写(:
六:还有很多可以写的:
使用教程(AI),但是包括画图的,ChatGPT的,文字生成语音的。里面又会细分到各种领域。
模型对比:ChatGPT综合能力很强,但是推理能力被Claude3完爆
AI资讯:Claude最近的动态,谷歌的对策,OpenAI的GPT5.
……………………
……………………
……………………
谁来写一下(
摸鱼去了
Last edited by @billy_xu 2024-03-30T05:58:21Z