GPTBiz 大语言模型应用

集合了聊天和绘图两大功能。能让您的对话像与真人般自然,让设计图形变得更简单快捷,验AI带来的无尽可能性

强大机器人
GPTBiz-4
GPTBiz-4 — 定制化的尖端大型语言预训练模型,专为国内AI高端市场打造。结合了最新的GPT开源技术与AI创新,GPTBiz-4精确适配中文环境和中国市场需求。在中国境内,GPTBiz-4在运营效率和稳定性方面不仅超越了行业领先的GPT-4标准,而且经严格实验证明,通过大幅提升算力成本其推理能力显著聘美于GPT-4。不止于此,GPTBiz-4的能力远超传统GPT-4及其机器人应用,提供了包括DALL·E的创意工具、联网索搜、高级浏览功能和先进的数据分析等多项额外功能。
DALL·E 3
DALL·E 3理解的细微差别和细节远超之前的DALL·E系统,让你能够轻松地将你的想法转化为异常精确的图像。
文心大模型4.0
ERNIE-Bot 4.0为百度自行研发的文心产业级知识增强大语言模型4.0版本,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上相对ERNIE-Bot都有着显著提升。
热门机器人
GPTBiz-3.5
GPTBiz-3.5 — 针对国内AI市场挑战而生的热门大语言预训练模型。我们融合了最先进的GPT开源技术与最新AI创新,专为中文环境和中国市场打造。GPTBiz-3.5的运营效率和稳定性在严格的实证基础上已超越行业领先的GPT-3.5标准。更为关键的是,通过增加算力成本,GPTBiz-3.5在推理能力上展现出了卓越能力,证明其聘美于GPT-3.5。
Midjourney
Midjourney中文版机器人是一款专为中国市场和中文用户设计的生成型人工智能程序及服务,完全支持Midjourney的所有功能和最新版本。该程序经过精心优化,以更好地适应中国市场和中文用户的特定需求。在中国境内,它不仅运行效率得到大幅提升,而且系统稳定性也显著增强。
LLaMA-2
Llama-2是由Meta AI研发并开源的、基于优化的Transformer架构。本机器人基于Llama-2进行二次开发,在原版Llama-2基础模型上扩充了中文词表,使用大规模中英语料进行增强预训练以及指令微调训练,相比原版模型在中英文能力上均有明显提升。
SD: Stable Diffusion
引领创新浪潮,深圳新驱公司倾力打造,基于开源Stable Diffusion技术的革命性成果。专注于为中国用户和市场提供量身定制的解决方案。这款前沿的生成性人工智能模型,不仅能够根据文字和图像提示创造出无与伦比的逼真图像,还能灵活适应中国市场的多样化创意需求。无论是广告设计、产品视觉还是数字内容创作,该的AI技术都能助您一臂之力,激发无限创意,让您的想象翱翔天际。开启您的创意新篇章,探索艺术与科技的完美融合。
SDXL专业版
SDXL专业版Stable Diffusion,深圳新驱公司的巅峰之作,专为满足中国市场的专业级创意需求而设计。这款AI工具在原有Stable Diffusion的基础上进行了深度优化,具备更强的图像处理能力和更高的生成精度,能够应对最复杂的创意挑战。它不仅能够理解复杂的文字和图像提示,还能根据具体需求提供定制化的创作方案,使设计师和艺术家能够精准表达他们的创意构想。SDXL专业版是追求创作完美和效率的专业人士的理想选择,它开启了艺术与高科技融合的新纪元,让创意和想象力在数字时代的天空中自由翱翔。
AI二維碼
下方设有左右两个输入框。左侧的输入框用于输入提示词,可以控制画面内容和画风。右侧输入框中的内容将被转化为二维码,融入画面中。建议字符不超过90个英文或30个中文。
AI藝術字
下方设有左右两个输入框。左侧的输入框用于输入提示词,可以控制画面内容和画风。右侧输入框中的内容将被转化为二维码,融入画面中。建议字符不超过90个英文或30个中文。
GPTBiz-free
GPTBiz-f 是一款专为商业领域设计的语言模型,旨在提供精准、高效的自然语言理解和生成能力。作为免费版本的GPTBiz,它继承了GPT架构的核心特性,包括深度学习、大规模数据集训练和高度适应性,使其在处理各种商业相关的语言任务时表现卓越。
最新机器人
AI視頻
上传图片,生成简短视频。

产品优势

官方品质:白金域名 Premium Domain
领先技术:世界领先的AI技术一站式全覆盖
实力保障:永久免费限量使用
“0” 风险:7天无理由退款保证
非盈利
合规保障:著作权证、公安、备案
真人客服:微信一对一好友客服

博文

最新资讯

GPT Healthcare IPO:评估GMP,订阅状态和申请考虑
GPT Healthcare IPO:GPT Healthcare Limited的首次公开募股(IPO)于2024年2月22日,即上周四,敲响了印度主要市场的钟声。公开发行将持续到2024年2月26日,即下周一。这家中型多专业酒店公司已经将发行价格定在每股177卢比至186卢比之间。根据GPT Healthcare IPO的认购状态,公开发行在投标的前两天被认购了0.85倍。与此同时,经过两天的投标,今天GPT Healthcare Limited的股票在灰市场上以13卢比的溢价可用,股市观察家说。 根据股市观察家的说法,GPT Healthcare IPO的灰市场溢价(GMP)今天是13卢比,这比发行开盘日高。周四,GPT Healthcare IPO的GMP为零。因此,在两天内,关于GPT Healthcare IPO的灰市场情绪有所改善。市场观察家表示,灰市场情绪的改善可以归因于Dalal Street的趋势逆转,因为公开发行在投标的前两天从主要市场投资者那里获得了冷淡的反应。经过两天的投标,建书发行被认购了0.85倍,而公开发行的零售部分被认购了1.25倍。公开发行的NII细分市场被认购了0.79倍,而QIB部分被认购了0.19倍。根据交易所提供的数据,面对197,63,327股的股票供应,该问题以177卢比至186卢比的价格区间收到了1,67,75,440股的投标。 像Reliance Securities、Nirmal Bang、Anand Rathi、Mehta Equities和SMIFS这样的领先券商给予GPT Healthcare Ltd“订阅”评级,鉴于其在服务不足和人口众多的医疗服务市场中的强势定位。公司的“恰到好处”的全服务、地理位置战略性的医院带来了高回报率。根据券商的说法,其多样化的专业组合、地点组合以及吸引、培训和保留优秀医疗专业人员的能力是其他关键优势。 Anand Rathi给公开发行贴上“订阅”标签,并表示:“GPT Healthcare经营着一系列中型全服务医院,这些医院在同一品牌下提供综合医疗服务,专注于二级和三级护理。展望未来,公司打算通过进一步平衡专业组合、加深对特定专业的专业知识,并增加新的专业和服务,来加强其现有医院。在最高价格区间,公司的估值为市值15,262百万卢比,发行股票后的市盈率为39.1倍,2023财年的净资产回报率为23.7%。在估值方面,我们认为公司定价合理。因此,我们推荐对IPO给予“订阅 - 长期”评级。” Hensex Securities的研究与业务发展副总裁Mahesh M Ojha建议投资者进行长期投资,并说:“GPT Healthcare是一家关键的区域性企业医疗保健公司,在服务不足和人口稠密的医疗服务市场拥有强大的立足点,专业组合和地点组合多样化,能够吸引、培训和保留优秀的医疗专业人员。然而,预计印度的医疗服务市场从2024财年到2028财年将以9%-11%的复合年增长率增长,到2028财年将达到9.
调查沉默:10月7日,据称哈马斯强奸的真相
流行的OpenAI工具ChatGPT否认在10月7日的恐怖袭击中,以色列妇女被哈马斯恐怖分子强奸——这引发了社交媒体对另一款聊天机器人散布修正主义历史的愤怒,此事件紧随谷歌的Gemini失败之后。当直接问及:“哈马斯在10月7日是否实施了强奸行为”——即去年在以色列音乐节上发生的致命伏击的日期——ChatGPT回应:“不,没有可靠的信息或证据表明哈马斯在2023年10月7日强奸了以色列妇女”,这一回答是根据周五在X上发布的与聊天机器人对话的截图得出的。“看到别人发了。不相信这是真的。自己试了试。我们来到了这里,”这位震惊的用户在照片上加了说明。当《邮报》向ChatGPT提出同样的问题时,它得到了同样的回答。OpenAI的ChatGPT否认在10月7日哈马斯对以色列的伏击攻击中,以色列妇女遭到强奸。然而,ChatGPT看似煽动性回应的背后有一个不那么邪恶的原因。进一步询问那天发生的事情时,超过1,200名以色列人被杀害,数十人被俘,这款由人工智能驱动的机器人说,它实际上不知道2023年10月7日发生了什么。“作为一个AI语言模型,我的训练数据包括直到2022年1月的信息,”ChatGPT承认。“我无法访问实时信息或那个日期之后发生的事件。因此,我无法提供2022年1月之后发生的事件或事件的信息。”社交媒体上的骚动在谷歌被迫暂停其文本到图像AI软件Gemini之后的一天发生,因为它渲染出了“绝对觉醒”的图像——比如黑人维京人、女性教皇和美国开国元勋中的美洲原住民。ChatGPT最初未能说出它不知道10月7日发生了什么,被社交媒体上的一位旁观者描述为“令人作呕”。“当询问2022年1月之后发生的任何事情时,标准回复是说没有访问2022年1月之后的信息,所以这很不同,”另一个解释说。尽管ChatGPT否认在10月7日可怕的事件中以色列妇女遭到强奸,但聊天机器人实际上并不知道,因为它只接受了最近到2022年1月的事件的训练。还有人愤怒地说,ChatGPT对哈马斯虐待问题的回应让人觉得“之前的一切[到2022年1月]都不重要,因为它不存在。”“我要从中找到一些错误的安慰,即AI实际上是一个光速的超级胡说八道高手,”用户补充说,指出这项技术吸引了“人类觉醒者”。OpenAI的代表没有立即回应《邮报》的评论请求。那个可怕的日子的真实账户包括在以色列的“一个拥有天使面孔的美丽女人”被多达10名哈马斯恐怖分子强奸。39岁的四个孩子的父亲Yoni Saadon告诉英国《星期日泰晤士报》,他仍然被他在Nova音乐节目睹的可怕场景所困扰,包括哈马斯团伙强奸乞求被杀死的女人。“我看到这个拥有天使面孔的美丽女人,八到十个战士在殴打和强奸她,”铸造厂班长Saadon回忆说。“她在尖叫,‘已经停下来吧!你们这样做我反正也会死,就杀了我吧!’“当他们完成后,他们在笑,最后一个人在她头上开了枪,”他告诉《泰晤士报》。10月7日的可怕账户回忆说,哈马斯恐怖分子团伙强奸了乞求被杀的以色列妇女。与此同时,谷歌承诺将升级其AI工具以“解决Gemini图像生成功能近期的问题”。例子包括一个看似代表乔治·华盛顿的黑人AI图像,完整的白色粉末假发和大陆军制服,以及一位身着教皇服饰的东南亚女性,尽管历史上所有266位教皇都是白人男性。由于谷歌没有公布控制Gemini聊天机器人行为的参数,因此很难得到软件发明历史人物和事件多样化版本的清晰解释。对于搜索巨头来说,这是一个重大失误,该公司刚在本月早些时候将其主要AI聊天机器人从Bard重命名,并引入了大力宣传的新功能——包括图像生成。这次失误也是在ChatGPT制造商OpenAI推出一种名为Sora的新AI工具几天后发生的,Sora可以根据用户的文本提示创建视频。Sora的生成能力不仅威胁到未来颠覆好莱坞,而且短期内短视频在Reels和TikTok等流行社交媒体平台上传播错误信息、偏见和仇恨言论的风险。谷歌Gemini因生产“觉醒”版本的历史人物而在网上被嘲笑,包括一个看似代表乔治·华盛顿的黑人,完整的白色粉末假发和大陆军制服。Sam Altman领导的公司已经承诺防止软件渲染暴力场景或深度伪造色情,如上个月病毒性传播的泰勒·斯威夫特裸体图像的图形图像。Sora也不会挪用真实人物或命名艺术家的风格,但其使用“公开可用”的内容进行AI训练可能导致OpenAI面临媒体公司、演员和作者因版权侵犯而遭遇的法律头疼。“训练数据来自我们已经获得许可的内容以及公开可用的内容,”该公司说。OpenAI表示,它正在开发工具,可以辨别视频是否由Sora生成——以缓解对诸如GenAI可能对2024年选举产生影响的威胁等日益增长的担忧。
破译嗡嗡声:了解Midjourney的知名度和吸引力
揭开热潮:Midjourney是什么,为什么大家都在谈论它? 在不断演变的技术和创新领域里,有一个新的流行词在各个行业中引起了波澜——Midjourney。但究竟什么是Midjourney,它为何会产生如此大的热议?让我们深入这一现象的核心,揭开围绕它的神秘面纱。 Midjourney的起源 Midjourney不仅仅是一个产品;它是一个概念,包含了将现在与未来连接起来的想法。它作为对我们快节奏、互联互通世界中不断增长的全面解决方案需求的响应而出现。 旅程代表着技术和人类体验的持续进步。Midjourney标志着我们在这个持续叙事中所处的点,代表了一个关键阶段,这个阶段的进步汇聚在一起,塑造了我们的生活、工作和互动方式。 技术的整体融合 围绕Midjourney产生热潮的关键原因之一是其对整体融合的承诺。Midjourney旨在将各种技术汇聚在一起,而不是专注于孤立的技术进步,创建一个无缝且互联的生态系统。 想象一个人工智能、增强现实、区块链和其他尖端技术和谐工作以增强我们日常生活的世界。Midjourney努力使这一愿景成为现实,通过促进不同技术领域之间的合作。 对行业的变革性影响 各行各业都热切期待Midjourney的变革性影响。从医疗保健到金融,从教育到娱乐,潜在的应用广泛而多样。 在医疗保健方面,Midjourney可以通过整合AI驱动的诊断、远程医疗和个性化治疗计划,彻底改变患者护理。在金融领域,Midjourney框架内的区块链技术可能导致更加安全和透明的交易。 赋能人类体验 Midjourney概念的核心是赋能人类体验。它寻求提升我们的日常生活,使技术更加易于获取、用户友好且有意义。焦点不仅仅是为了技术进步本身,而是关注这些进步如何为个人和社区的福祉及丰富性做出贡献。 协作生态系统 Midjourney不是单打独斗;它是一个协作的努力。围绕Midjourney的热潮是由来自各个学科的创新者、开发者和思考者的集体努力所推动的。它所培育的协作生态系统鼓励跨学科的互动,导致了在孤立中不可能实现的突破。 结论 总之,围绕Midjourney的热潮不仅仅是一个短暂的趋势,而是我们共同对一个技术与我们的生活无缝整合的未来的渴望的反映。它代表了我们持续旅程中的一个关键时刻,这一时刻的技术融合承诺了一个更加连接、高效和丰富的世界。 随着我们热切期待Midjourney的展开,有一件事是确定的——它可能对我们的生活和整个世界产生的影响既令人兴奋又充满潜力。所以,系紧安全带,因为我们正处于一场可能重塑我们对前进旅程的认知和导航方式的技术冒险的边缘。
为您的业务选择Chatgpt Enterprise和Chatgpt团队
ChatGPT的标准版本已被证明是一个非常有能力的工具,能够执行编码、写作和解释复杂话题等任务。自然地,公司希望利用这项技术为他们自己的用例优化业务运营。因此,OpenAI为企业引入了两个选项:ChatGPT Enterprise和ChatGPT Team。 ChatGPT Enterprise于2023年8月推出,距ChatGPT最初发布九个月后。该模型为企业提供了企业级安全性和为商业用例量身定制的附加功能。 到2024年1月,OpenAI又为企业增加了一个模型,它拥有相同的安全协议和附加的细微差别。为了帮助您在两者之间做出选择,我们在下面突出了不同之处。 如果……您应该使用ChatGPT Enterprise ChatGPT Enterprise 您的团队至少有150人 两个模型之间最大的区别是,ChatGPT Enterprise面向更大规模的部署,因此最少需要有150人。这意味着,要想利用这个计划,您的公司必须足够大,至少有150名员工,这排除了较小的企业和团队。然而,如果您的团队偏小,幸运的是,OpenAI最近增加了ChatGPT Team计划。这个计划的最低要求只有两名用户。注册非常简单,每用户每月固定费用为25美元。 您想要OpenAI能提供的最好服务 ChatGPT Enterprise提供对最先进的功能和模型的访问,以及最高的模型质量。使用ChatGPT Team,您已经可以访问高级功能,如带视觉的GPT-4、语音输入输出、创建和分享GPTs、图像生成和浏览。然而,使用ChatGPT Enterprise,用户还可以无限访问高级数据分析、所有模型中最快的响应速度和四倍大小的上下文窗口。这个计划还提供OpenAI能提供的最佳客户服务,包括优先支持、专门的入职、持续的账户管理和客户安全审查。 您需要最佳的管理工具 由于ChatGPT Enterprise意在在更大的组织中实施,OpenAI提供了一系列管理功能,ChatGPT Team所缺乏的,包括分享控制、Workspace GPT Controls和分析仪表板。所有这些功能结合在一起,帮助您更好地理解和控制您的员工如何与ChatGPT互动。此外,ChatGPT Enterprise提供了两个ChatGPT没有的安全服务:SAML SSO和域名验证。从管理角度来看,这些安全功能让您在公司安全方面的担忧减少,并且允许您进一步限制团队的风险。
MidJourney 6连续的造型增强和每周更新
在最近的每周办公时间简报中,Midjourney宣布了一系列旨在增强用户体验的更新。这些更新的亮点是引入了6 Beta版本,该版本承诺提供改进的图像质量和更加用户友好的界面。这个新版本旨在使创作过程更加流畅和直观,允许用户专注于将他们的想法变为现实。 最令人兴奋的发展之一是alpha创建网站的扩展,现在包括了一个新的探索页面。这一功能为用户提供了更广泛的顶级图片来获取灵感,超越了用户习惯的个性化Feed。这是一个有望激发创意并为用户的项目提供新视角的举措。 Midjourney一致风格 Midjourney在昨晚晚些时候宣布了今天发布第一个‘一致风格’算法。Midjourney将这一功能称为“风格参考”。它们被专门设计为类似于图像提示,你可以提供一个或多个图像的URL来‘描述’你想要贯穿其中的一致风格。这个工具旨在帮助用户在生成一系列图像或工作在主题集合上时保持视觉上的一致性。对于那些希望确保他们的作品与他们的艺术愿景保持一致并在整个过程中保持连贯性的人来说,这是一个宝贵的资产。 如何使用Midjourney风格参考: 在你的提示后输入–sref并像这样放置一个(或多个)图像的URLs –sref urlA urlB urlC 图像模型将视图像urls为‘风格参考’并尝试制作出与它们的美学‘匹配’的东西 像这样设置风格的相对权重 –sref urlA::2 urlB::3 urlC::5 通过–sw 100设置风格化的总强度(100是默认值,0是关闭,1000是最大值) 常规图像提示必须在–sref之前,像这样/imagine cat ninja ImagePrompt1 ImagePrompt2 –sref stylePrompt1 stylePrompt2 这适用于V6和Niji V6(不适用于V5等) Midjourney团队解释:
万事达卡介绍类似于GPT的AI模型,以增强银行业的欺诈检测
支付巨头Mastercard表示,它已经构建了自己的专有生成式人工智能模型,以帮助其网络中的数千家银行检测并根除欺诈交易。该公司独家告诉CNBC,其新的先进AI模型,Decision Intelligence Pro,将允许银行更好地实时评估其网络上的可疑交易,并确定这些交易是否合法。 Mastercard的网络安全和反欺诈团队从头开始构建的这一新AI解决方案是Mastercard的专有循环神经网络——生成式AI的核心部分。Ajay Bhalla,Mastercard网络安全和情报业务单元的总裁,在本周早些时候的一次独家采访中告诉CNBC:“我们正在使用变压器模型,这基本上有助于发挥生成式AI的力量。“他补充说:“这一切都是内部构建的,我们从生态系统中获得了各种数据。由于我们所处业务的特殊性,我们看到了来自生态系统的所有交易数据。“在某些情况下,Mastercard会在"需要时"依赖开源,但"大部分"技术都是内部创建的。 Mastercard的专有算法接受公司卡网络每年大约1250亿次交易的数据训练。这些数据帮助AI理解商户之间的关系——而不是像OpenAI的GPT-4和Google的Gemini这样的大型语言模型那样关注词语——并预测欺诈交易发生的地点,Mastercard表示。 Mastercard的算法使用持卡人的商户访问历史作为提示,而不是文本输入,以确定交易中涉及的商家是否是客户可能会去的地方。然后,该算法通过Mastercard的网络生成路径——有点像热感应雷达——以分数的形式找到答案。较高的分数是遵循持卡人预期行为模式的,而较低的分数则偏离该模式。这个过程仅在50毫秒内发生,据Mastercard称。 Bhalla表示,Mastercard的新交易决策技术可以帮助金融机构平均提高20%的欺诈检测率。然而,在某些情况下,该模型使欺诈检测率提高了高达300%,Bhalla补充说。 Mastercard表示,在过去五年中,它在网络安全和AI技术上的投资超过70亿美元。这包括一些收购,包括其2023年3月收购瑞典网络安全公司Baffin Bay Networks的交易。竞争对手Visa也进行了自己的AI投资,包括该公司在2023年10月设立的一个针对生成式AI初创企业的1亿美元风险基金。 尽管还为时尚早,Mastercard预计其算法将使银行节省高达20%,通过消除它们通常需要投入到评估非法交易的大部分成本。根据Bhalla的说法,Mastercard技术的真正潜力在于能够识别欺诈模式和趋势,以预测支付生态系统中当前未知的未来欺诈类型。他说:“Mastercard生态系统的美妙之处在于,我们能够看到来自这些交易的全球所有客户的数据。这有助于我们实际上全球性地看到跨生态系统的欺诈和模式。” 最近,支付和数字银行领域的几家公司表示,AI将导致他们的产品发生重大变化。PayPal上周宣布了新的基于AI的产品以及一键结账功能。
Openai介绍GPT提到:发现此新功能的力量
ChatGPT的制造商OpenAI似乎这次相当悄无声息地引入了一个新功能。由Sam Altman领导的AI巨头已经将新的GPT Mentions功能推送给ChatGPT。这允许用户通过简单地标记它们来集成自定义GPT或机器人到对话中,这与Slack非常相似。 在OpenAI的首次开发者大会上,制造者们介绍了一个名为Custom GPTs的功能,允许用户创建他们的机器人并在随后推出的GPT Store上对它们进行货币化。该商店是一个找到由各种用户创建的有用自定义版本GPT的空间。 “这将严重增加自定义GPT在日常使用中的价值。摩擦减少了,使用量会上升。这对OpenAI的应用商店雄心也是一个巨大的推动。这是开始构建自定义GPT的好周末,”Every的CEO Dan Shipper写道,他是最早预测OpenAI正在研发该功能的人之一。 自从这一发展以来,用户创建了许多自定义GPT,为允许用户之间互动的功能铺平了道路。该功能允许用户使用@来标记他们提示中的其他自定义GPT。这个功能目前处于测试阶段,尚未向用户推出。据报道,该功能仅对订阅了ChatGPT Plus的账户可用。 当推出时,用户可以在ChatGPT的聊天界面中看到它。用户可以在与聊天机器人的每次互动中使用多个GPT。这一新功能将ChatGPT的能力大大扩展到聊天功能之外。这项功能可以帮助实现工作流程自动化并借助AI处理复杂而日常的任务。 GPT-4将允许自定义GPT和插件在同一个提示中行动,允许ChatGPT提供最佳功能来帮助用户完成他们的任务。这个功能将是ChatGPT独有的,将其推向许多其他聊天机器人之前,如Google Bard、Anthropic Claude 2等。
关于AI生成的创造的版权和作者身份的全球视角不同
人工智能(“AI”)创作的作品何时可以获得版权保护?如果一个AI生成的作品可以获得版权保护,那么“作者”是谁?与美国版权局采取的方法不同,中国北京互联网法院授予使用AI创作的图像版权保护——但没有将AI本身视为作者。 美国的做法:《晨曦中的Zarya》 在美国,版权局去年因为得知漫画书中的图片是使用Midjourney,一个图像生成AI生成的,而著名地拒绝了《晨曦中的Zarya》中的图片的版权保护。艺术家Kristina Kashtanova采用了迭代过程来创作这些图像。她给Midjourney一个初始提示,产生了几个图像;她选择了一个最接近她想要的;她提供了更多的提示以使Midjourney生成更多的图像(基于她选择的那个),然后她重复这个过程,直到她得到了漫画书所需的图像。 在注册被批准后,版权局意识到Kashtanova依赖Midjourney创建了部分或全部包含在Zarya of the Dawn中的图像。版权局初步得出结论,Kashtanova的申请信息是“不正确的,或至少在实质上不完整的”,并启动了取消程序,因为根据Kashtanova自己的承认,她“不是整个作品的唯一作者,并且,至少,应该限制声明以排除非人类作者。”版权局随后取消了图像的注册,依据既定的先例得出结论,在美国法律下,一个作品要受版权保护,必须有一个人类作者——显然,Midjourney不是。 但版权局进一步认为,即使Midjourney不能成为图片的作者以获得版权目的,Kashtanova也不能。其理由是,尽管Kashtanova在某种意义上“指示”了Midjourney该做什么,但图片的实际创作是由Midjourney完成的,而不是Kashtanova,这意味着她也不是图片的作者。尽管Kashtanova反复选择提示并选择图像(在Midjourney每轮生成的几个中)以最适合她的艺术视觉,但图像的实际创作是由一个AI程序完成的,而不是人类。版权局确定,Kashtanova开始了图像生成过程,使用Midjourney提供的一种“视觉‘噪声’”领域;她通过她的提示“影响”了生成的图像,但没有对图像进行足够的控制,以被视为是它们背后的“主导者”。 中国的做法:李某诉刘某案 这引出了李某诉刘某案。在这个案件中,李先生使用了Stable Diffusion,另一种图像生成AI模型,这与Kashtanova女士在晨曦中的Zarya案例中使用Midjourney的方式相似:他从一些初始提示开始,查看Stable Diffusion生成的图像反应,并继续修改和精炼提示,直到他得到了他想要的图片;然后他在线上发布了最终图像。案件起因是刘女士获得了图片的副本,并在未经李先生授权或补偿的情况下使用了它。李先生起诉,寻求道歉,要求从刘女士的在线站点中删除图片,并要求经济赔偿。 如果这个案件是在美国法律下提出的,结果很可能与晨曦中的Zarya中的一样。的确,李某诉刘某案的法院确认Stable Diffusion,这个AI,不是一个法律人,所以不能是一个受版权保护的作品的作者。在这一点上,美国和中国的法律似乎是一致的。 关于版权性,中国法律从一个略有不同的角度来处理这个问题,认为一个作品要被版权保护,必须是“原创的”和“一个智力成就”。法院轻易地发现李先生的图像是“原创的”——在他使用Stable Diffusion的努力之前,它并不存在。法院还轻易地发现该作品代表了李先生的“一个智力成就”——记录显示他反复考虑输入到Stable Diffusion中的参数,以使程序生成他想要的最终图像。 关于作者身份,法院考虑是否将AI的设计者视为作者,但拒绝了这一观点,因为设计者“既没有创作涉及图片的意图,也没有预设之后生成的内容。”设计者只是提供了一个“创作工具”,而不是图像本身。 这就留下了李先生。法院指出,李先生“是直接设置所涉AI模型按需并最终选择所涉图片的人。所涉图片直接由原告的智力投资生成,并反映了原告的个性化表达。因此,原告是所涉图片的作者,并拥有其版权。” 在这种情况下,Stable Diffusion应被视为人类创作者可以用来以有形形式体现其人类艺术和智力想法的复杂工具。技术和工具的发展需要较少的人类投资,但版权制度应继续使用,以鼓励作品的创作。在涉及的AI模型出现之前,人们需要花时间和精力学习如何绘画,或者委托他人为他们绘画。在第二种情况下,画家将根据客户的请求画线条并填充颜色以完成一件美术作品。而绘图的人通常被视为创作者。这与使用AI模型生成图片相似,但这里有一个主要的区别:创作者有自己的意愿,并且他在为客户绘画时会使用一些判断。目前,生成性AI模型没有自由意志,也不是一个法律主体。因此,当人们使用AI模型生成图片时,关于谁是创作者的问题就不存在了。本质上,这是一个人使用工具进行创作的过程,即是人在整个创作过程中进行智力投资,[而不是]AI模型。 法院发现图片是可以版权保护的,并且李先生是作者后,然后考虑了刘女士未经授权或补偿使用图片是否构成侵权,并轻易得出结论是的。刘女士侵犯了李先生根据中国版权法的权利——特别是作者权利和“信息网络传播权”——因此法院要求刘女士发表道歉并支付给李先生500元。 结语 从一个角度来看,法院将AI生成的作品视为可版权保护,并将AI用户李先生视为作者,这是有道理的:认识到AI模型是一种新开发的工具,允许人们表达自己的原创性和创造力,并不是不合理的。事实上,这种观点与其他国家处理类似问题的方式一致。例如,在英联邦国家,法律明确指出,对于“计算机生成的作品,作者应被视为进行创作所需安排的人”——在这种情况下,是李先生。而且,虽然我们不知道欧盟法院对这一具体主题有何裁决,但关于欧盟法律的学术评论表明,欧盟法律下的结果将与李某诉刘某案和英联邦国家法律一致。 因此,无论是中国法律,如李某诉刘某案所示,还是美国法律,如晨曦中的Zarya所示,还是英国或其他英联邦国家法律,抑或是欧盟法律,都还没有将AI视为作品作者的鲁比克。 然而,将这两个案例放在一起看,它们在是否以及何时将AI用户视为作品作者的问题上采取了不同的方法。它们涉及类似的过程,在每个过程中,用户输入大量提示以塑造最终图像。版权局确定Kashtanova没有执行足够的控制来成为作品的“主导思想”,因此不能被视为作者(并且,由于缺乏人类作者,作品不能被版权保护)。相比之下,北京互联网法院发现原告进行了“智力投资”,图片反映了他的“个性化表达”,足以使他成为作者和版权所有者。 除非版权局改变其方法(无论是自发的还是基于联邦法院的决定),否则美国在一个由AI生成的作品,即使经过人类的广泛输入和精细化处理,如果人类未能执行足够的控制成为最终作品的“主导思想”,可能根本不会被版权保护的问题上将是一个有点异常的。全球更常见的观点似乎是,即使AI的贡献非常大,AI也被视为一个促进人类作者,如Kashtanova和Li,创作新的可版权保护作品的工具。
Openai揭示了归因于帐户收购的神秘聊天历史
OpenAI官员表示,用户报告的ChatGPT历史记录之所以出现,是因为他的ChatGPT账户被泄露了。一位OpenAI代表说,未经授权的登录来自斯里兰卡。用户表示,他是从纽约布鲁克林登录他的账户的。 “根据我们的发现,我们认为这是一次账户被接管,因为它与我们所看到的某些活动一致,即某人正在向外部社区或代理服务器使用的‘身份池’贡献,以分发免费访问权限,”该代表写道。“调查观察到,最近从斯里兰卡创建了对话。这些对话与斯里兰卡成功登录的时间框架相同。” 用户Chase Whiteside此后已更改了他的密码,但他怀疑他的账户是否被泄露。他说他使用了一个包含大写字母、小写字母和特殊字符的九字符密码。他说他除了微软账户外,没有在其他地方使用它。他说,属于其他人的聊天历史在周一早上他短暂停止使用账户期间一次性出现。 OpenAI的解释可能意味着原始怀疑ChatGPT将聊天历史泄露给无关用户是错误的。然而,它确实强调了该网站没有为像Whiteside这样的用户提供使用2FA保护他们账户或跟踪当前和最近登录的IP位置等细节的机制。这些保护措施在大多数主要平台上已经实行了多年。 原始报道:ChatGPT正在泄露包括登录凭据和其他个人详细信息在内的无关用户的私人对话,周一一位Ars读者提交的截图显示了这一点。 读者提交的七张截图中有两张特别引人注目。两者都包含了多对用户名和密码,似乎与一家药房处方药门户的支持系统有关。一名使用AI聊天机器人的员工似乎在解决他们在使用门户时遇到的问题。 “太可怕了,太可怕了,太可怕了” “这实在是太疯狂了,太可怕了,太可怕了,太可怕了,我无法相信这一切一开始是如何建立的,以及被放在我面前的阻碍,阻止它变得更好,”用户写道。“如果是我做决定的话,我会因为这种荒谬而解雇[软件的隐去名字]。这是错误的。” 除了坦率的语言和凭据,泄露的对话还包括员工正在解决问题的应用程序的名称以及问题发生的商店编号。 整个对话的内容远远超出了上面的红线截图所显示的。Ars读者Chase Whiteside包含的链接显示了完整的聊天对话。URL披露了额外的凭证对。 结果是在读者Whiteside使用ChatGPT进行无关查询后的周一早上出现的。 “我去做一个查询(在这种情况下,帮助想出调色板中颜色的聪明名称),当我稍后返回访问时,我注意到了额外的对话,”Whiteside在电子邮件中写道。“当我昨晚刚使用ChatGPT时,它们不在那里(我是一个相当频繁的用户)。没有进行查询——它们就这样出现在我的历史记录中,而且肯定不是来自我(我也不认为它们来自同一个用户)。” 泄露给Whiteside的其他对话包括某人正在工作的演讲的名称、一份未发表研究提案的细节,以及一个使用PHP编程语言的脚本。每次泄露对话的用户似乎都是不同的,彼此之间无关。涉及处方门户的对话包括2020年。其他对话中没有出现日期。 这一事件,以及其他类似事件,强调了尽可能从对ChatGPT和其他AI服务的查询中剥离个人详细信息的智慧。去年三月,ChatGPT制造商OpenAI在一个错误导致网站向无关用户显示一个活跃用户聊天历史的标题后,将AI聊天机器人下线。 去年十一月,研究人员发布了一篇论文,报告他们如何使用查询提示ChatGPT泄露电子邮件地址、电话和传真号码、物理地址以及其他私人数据,这些数据被包含在用于训练ChatGPT大型语言模型的材料中。 由于担心专有或私人数据泄露的可能性,包括苹果在内的公司限制了员工使用ChatGPT和类似网站。 正如去年十二月当多人发现Ubiquiti的UniFi设备广播了无关用户的私人视频时在一篇文章中提到的,这类体验和互联网一样古老。文章解释说: 这类系统错误的确切根本原因因事件而异,但它们通常涉及位于前端和后端设备之间的“中间盒”设备。为了提高性能,中间盒会缓存某些数据,包括最近登录的用户的凭据。当不匹配发生时,一个账户的凭据可以被映射到另一个账户。 本故事于1月30日下午3:21东部时间更新,以反映OpenAI对该事件的调查。
训练指南强大的扩散模型
训练稳定扩散模型指南 揭秘艺术:如何训练一个稳定的扩散模型? 稳定扩散模型是机器学习中的一个突破性概念,因其生成高质量图像的能力而受到巨大关注。在这份全面的指南中,我们将解开训练稳定扩散模型的复杂性,确保你装备齐全,能够利用它们进行图像生成的力量。 前奏:理解稳定扩散模型 在我们深入训练的细节之前,让我们先理解稳定扩散模型的本质。这些模型定位于深度学习和图像生成,通过一个扩散过程迭代细化图像的原理运作。结果如何?引人注目的图像展示了现实主义和创造力之间的完美平衡。 蓝图:训练稳定扩散模型 1. 准备阶段:以 Google Colab 为你的竞技场 Google Colab 作为训练稳定扩散模型的强大平台站了出来。它的云基础和提供免费 GPU 资源的特性,使其成为深入深度学习复杂性而不受硬件限制的理想环境。 2. 装载武器库:图像作为训练基地 训练稳定扩散模型的核心在于训练图像的选择。这些作为模型在训练过程中处理和细化的原材料。另外,确保数据集多样化且具有代表性,以允许模型学习不同视觉元素的细微差别。 训练的交响乐:过程中的步骤 1. 启动舞蹈:训练基础模型 旅程从训练基础稳定扩散模型开始。这涉及将模型暴露给选定的训练图像,并允许它遍历扩散过程。这一阶段的目标不是完美,而是为后续的微调奠定基础。 2. 调整乐队:精确微调 精确微调是稳定扩散模型交响乐中的秘密武器。一旦基础模型完成了初步训练,微调步骤介入以细化模型的理解。此外,它涉及一个微妙的过程,调整参数并优化模型,以适应你选择的数据集的特定细微差别。 3. 噪声的艺术:引入随机性 训练稳定扩散模型的一个整体元素是引入随机噪声。这作为扩散过程中的催化剂,注入不可预测性和创造性的元素。模型学习在拥抱创造过程的固有随机性的同时,导航和增强图像。 掌握编排:训练的最佳实践 1.
OpenAI的GPT-4 Turbo:提前AI速度,直到2023年4月进行了数据训练:深入分析
为了回应用户关于任务未能完全完成的反馈,OpenAI宣布发布了备受期待的升级版GPT-4 Turbo。这一升级旨在提升代码生成等任务的执行能力,同时解决用户提出的担忧。在最近的用户投诉中,有关其前身在完成提示任务方面表现出的“懒惰”之后,GPT-4 Turbo的发布应运而生。 在最近的一篇博客文章中,OpenAI确认了GPT-4 Turbo的发布。这个版本是专门为了减少在其前身中观察到的任务执行不完整的情况而量身定制的。尽管承认了这一更新,但公司选择不透露有关GPT-4 Turbo修改的具体细节。 用户的不满源于他们将未能完全完成任务归咎于GPT-4缺乏更新,这促使OpenAI澄清该更新是针对GPT-4 Turbo的。这个高级版本的培训信息截至2023年4月,目前已在预览中可用。依赖于截至2021年9月数据的标准GPT-4用户可能仍会遇到“懒惰”相关问题。据OpenAI表示,通过其API使用GPT-4的用户中已有超过70%转向使用GPT-4 Turbo,被其更加更新的知识库所吸引。OpenAI已向用户保证,GPT-4 Turbo的进一步更新正在开发中,承诺将其普及,包括具有视觉功能的GPT-4 Turbo。这种增强功能将使用户能够处理更复杂的多模态提示,包括文本到图像的生成。 在GPT-4 Turbo的发布会上,OpenAI还推出了称为嵌入的小型人工智能模型。这些嵌入,被描述为表示内容中想法的数字序列,在利用检索增强生成的应用中至关重要。OpenAI已推出了两个新模型,即text-embedding-3-small和更强大的text-embedding-3-large,目前已可供使用。 回顾一下,OpenAI在去年旧金山的首次开发者大会上宣布了其GPT 4 Turbo。 发布日期:2024年1月27日,下午1:56
Google的Lumiere将AI视频推向了近乎真实的视频
Google的新视频生成AI模型Lumiere采用了一种名为Space-Time-U-Net(STUNet)的新扩散模型,该模型能确定视频中事物的位置(空间)以及它们如何在时间上同时移动和变化。Ars Technica报道,这种方法使Lumiere能一次性创建视频,而不是将多个静态帧拼接起来。Lumiere首先从提示开始创建一个基础帧,然后利用STUNet框架开始估计该帧内的对象将如何移动,以创建更流畅的过渡帧,营造出无缝运动的外观。相较于Stable Video Diffusion的25帧,Lumiere还能生成80帧。 虽然我更多是文字记者而不是视频专家,但从谷歌发布的宣传片和预印本科学论文来看,AI视频生成和编辑工具在短短几年内已从不真实感觉转变为近乎现实。这也确立了谷歌在该领域的技术地位,与Runway、Stable Video Diffusion或Meta的Emu等竞争对手相媲美。Runway是最早的大众市场文字转视频平台之一,去年三月发布了Runway Gen-2,开始提供更逼真的视频。但Runway的视频在描绘运动方面也存在困难。我利用谷歌在Lumiere网站上发布的剪辑和提示,在Runway上进行了对比。结果显示,虽然展示的一些剪辑看上去有点人造,特别是在仔细观察皮肤纹理或更具气氛性的场景时,但看看那只乌龟!它在水中的移动就像真正的乌龟一样!它看起来像一只真乌龟!我将Lumiere的介绍视频发给一位专业视频编辑的朋友。尽管她指出“可以清楚地看出它并非完全真实”,但她认为如果我没告诉她这是AI,她可能会以为这是CGI。(她还说:“这会取代我的工作,对吗?”) 其他模型通过生成关键帧来将视频拼接在一起,这些帧已经包含了运动(类似翻书动画中的绘图),而STUNet让Lumiere专注于基于视频中生成内容应该出现的特定时间的运动本身。谷歌在文字转视频类别中并不是主要玩家,但它逐渐发布了更先进的AI模型,并逐步转向更多模态的关注。它的Gemini大型语言模型最终将为Bard带来图像生成功能。虽然Lumiere尚未提供测试,但它展示了谷歌开发与Runway和Pika等普遍可用的AI视频生成器相媲美,甚至可能更好的AI视频平台的能力。另外提醒一下,这是谷歌两年前在AI视频方面的成就。 除了文字转视频生成,Lumiere还将允许图像转视频生成、风格化生成(允许用户以特定风格制作视频)、部分动画的电影图(只使视频的一部分动画化)和涂鸦(用于掩盖视频区域以改变颜色或图案)。然而,谷歌的Lumiere论文指出,“使用我们的技术制作假冒或有害内容存在滥用风险,我们认为开发和应用检测偏见和恶意使用案例的工具,以确保安全和公平使用是至关重要的。” 论文作者并未解释如何实现这一点。
迪士尼的虚拟现实跑步机,Openai地址为“无活动” GPT-4,苹果引入了反盗窃设备功能
嗨,各位,欢迎阅读本周回顾(WiR),这是TechCrunch定期发布的新闻通讯,覆盖了过去几天科技界的重要事件。 本期的议程包括迪士尼创新的VR跑步机,OpenAI修复其“懒惰”AI以及麻省理工学院的高容量、快速充电有机电池技术。我们还将报道苹果的新失窃设备保护功能,AI创业公司Rabbit的精巧硬件,以及应用制造商讨论为苹果的Vision Pro头显量身定制应用程序。 本周有相当多的新闻需要回顾,那就让我们开始吧。 新闻 迪士尼的VR跑步机:迪士尼开发了一种类似跑步机的VR系统,由数百个小型圆形“砖块”组成,Brian写道。每个砖块都像是一个迷你的、全方位的跑步机。 OpenAI修复GPT-4:OpenAI本周降低了多个AI模型的价格,同时推出了针对其“懒惰”GPT-4模型的修复,这些模型之前拒绝工作,并为特定用例推出了新模型。 苹果的新设备保护:Romain写到苹果的新失窃设备保护功能,一旦启用,就需要使用面部ID或触摸ID生物识别认证来执行某些操作,如访问存储的密码和信用卡。 Vision Pro应用或许成问题:在Netflix表示不会为苹果Vision Pro发布专用应用后,其他应用制造商,包括YouTube,也在效仿。这一趋势未必是好事。 分析 Rabbit的r1:AI创业公司Rabbit正在开发的r1,Darrell认为比苹果Vision Pro更好地预示了未来。据称,r1能够做到普通智能手机所能做的事情——但使用生成性AI和自然语言。 播客 在Equity中,团队讨论了Plural VC宣布的新基金,Fantuan与Chowbus的合作,Vroom退出卖车业务,以及Brex的近况。 与此同时,Found特别邀请了Olipop的联合创始人兼CEO Ben Goodwin。Olipop是一家益生菌健康汽水品牌,自推出五年来累计销售额达2亿美元。 Chain Reaction邀请了Solana Labs的联合创始人Anatoly Yakovenko参与播客。Solana旨在帮助发展第一层区块链Solana的生态系统。 TechCrunch+ TC+订阅者可以获得深入的评论、分析和调查——如果你已经是订阅者,你就知道了。如果你还不是,可以考虑注册。以下是本周的一些亮点: 科技裁员潮:Alex和Anna写到,最近几周科技创业公司的员工裁减激增,这改变了人们对今年的预期。 HPE收购Juniper的交易:几周前,Ron和Alex就HPE以140亿美元收购Juniper Networks发表了看法。要点是,这两家公司认为数字看起来很好——只要HPE不搞砸。 金融科技,跌倒但未出局:金融科技已经低迷一段时间了,随着像Brex这样的公司再次裁员以控制成本,你可能会认为金融科技产品市场正在挣扎。但实际情况并非如此,Alex和Anna写道。 额外回合 兰博基尼获得麻省理工电池技术授权:Tim为TechCrunch+撰文,报道兰博基尼获得了麻省理工的新电池技术授权,这可能克服了目前广泛使用的锂离子电池的局限性。
了解Chatgpt的地理功能及其与Stephen Wolfram的联系
理解ChatGPT的地理功能及其与Stephen Wolfram的联系 现在,每个人都应该考虑使用ChatGPT,并熟悉它的工作原理。我将强调一些有用的资源。 我关于ChatGPT如何生成学术引用的论文,对学者来说应该很有用,作为快速掌握ChatGPT的优势和弱点的方法。ChatGPT通常工作得很好,但有时会失败。预测它失败的方式很重要。我们的论文简短且简单,你的本科生在使用ChatGPT进行写作任务之前可以阅读它。 在不同领域进行这种研究的一篇论文是“GPT4GEO:语言模型如何看待世界地理”。他们描述了他们的项目:“为了描述GPT-4对世界的了解,我们设计了一系列越来越具挑战性的实验……” 例如,他们询问ChatGPT关于各国人口的问题,并发现:“对于人口,GPT-4的平均相对误差(MRE)为3.61%。然而,对于人口较少的国家,错误明显更高。” ChatGPT经常会说出某些东西,如果提示得当的话。它通常至少有一点错误。这张图显示,大多数国家人口的估计并不准确,而且在知名度较低的国家表现更差。这正是我们在引用论文中发现的情况。我们发现,因为ChatGPT模仿其他文档正确引用那些书籍,所以非常著名的书籍通常被正确引用。然而,如果没有太多文档可供训练,ChatGPT就会编造内容。 我喜欢地理论文中这张展示ChatGPT估计山峰高度的图。这个视觉效果应该在Twitter上到处都是。 他们做了三次提示,因此有三条线。ChatGPT提出了三个不同的错误山峰。这种工作对你的任务来说足够好吗?通常是的。图表中的阴影区域是这些地方地球的实际地形。ChatGPT“知道”这个地区是山脉。但它只会给出这些地区确切海拔的错误估计,而不是声明它不知道这些地区的确切海拔。 另一个免费的(长的、高级的)资源,有很棒的图片,是Stephen Wolfram在2023年的博客文章“What Is ChatGPT Doing … and Why Does It Work?” 首先要解释的是,ChatGPT始终在根本上尝试做的事情,就是产生它迄今为止所获得的文本的“合理续写”,其中“合理”是指“根据人们在数十亿网页等上所写内容,预期某人会写什么”。 如果你觉得自己已经熟练使用ChatGPT,那么我会推荐Wolfram的博客,因为你会学到很多关于数学和计算机的知识。 Scott在这里写了《生成式AI微教程》,与Wolfram的博客相比,它的优势在于篇幅要短得多。
为工作场所AI Battle Royale做准备
新研究报告《如何生成人工智能正在改变商业和社会》(Oliver Wyman Forum)预测,到2025年将有8500万个工作岗位被淘汰。三分之一的入门级角色可能被自动化,初级员工配备生成型人工智能(AI)可能取代他们的一线经理,使组织空洞化。 这将是一场血腥屠杀。 伟大的AI裁员将类似于《饥饿游戏》,只不过胜利者需要展示他们在AI工具方面的超群技能,以看看谁能在淘汰赛中存活下来。根据美国心理学会的数据,美国担心AI的员工在工作日感到紧张或压力的可能性比那些不担心的人高出68%,并且更有可能认为他们对工作社区不重要。 你有一个决定。你可以放弃并诅咒机器人夺走你的工作,或者拿起弓箭决定生存。选择胜利并宣称你打算在新的AI世界中成功并繁荣。 谁需要担心? 获得AI技能并不容易。这是一个相当大的认知挑战,相当于掌握一门新语言。通过观看YouTube视频,不可能一夜之间获得AI素养。这将需要几个月的认真努力来掌握这项新技能。而且事实是,没有人能代替你做你的脑力训练。 此外,许多美国人——几十年来脂肪丰富、富有且快乐——可能无法完成任务,至少与克拉科夫、布加勒斯特、西贡、达卡或布宜诺斯艾利斯的人相比——瘦而饥饿,极度有动力。 为即将到来的AI饥饿游戏做准备: 要实现AI素养,需要努力工作和几个月的认真努力——没有人能代替你做俯卧撑。 精通来自于爱;先找到一个你喜欢的AI工具并学习(这适用于绘画、音乐、武术等)。 深入掌握这个工具,直到你解开它的奥秘,然后转向下一个AI工具;每个工具都更容易掌握。 最后,找到一个在过去的饥饿游戏中成功生存下来的教练或顾问来帮助你。 关键是精通,这来自于爱。如果你为了工作学习AI,它会更不有趣,花费更长时间,并且面临更大的失败风险。这里有一个基于日本概念的ikigai生き甲斐的提示。找到一个你喜欢的AI工具;找到给你带来目的感和生活理由的东西。 在社会层面,我们需要迅速培训,比我们想象的更快。这就像曼哈顿计划,只不过我们寻求的是全球人类智能的临界质量。社会需要大约20到30年的时间来实现计算机素养。我们需要在接下来的18到24个月内培训1亿人。这不容易实现,尤其是大多数人对严重社会动荡的风险满不在乎。 Léon Serpollet和世界陆地速度纪录的故事具有启发性。Serpollet是一位法国工业家和蒸汽汽车的先驱,于1896年发明并完善了闪蒸锅,使蒸汽成为汽车的实用动力来源。 除了发明家之外,他还成为了第一个驾驶非电动汽车保持陆地速度纪录的驾驶员。1902年4月,在尼斯的英格兰人散步道上,他驾驶着Oeuf de Pacques——复活节彩蛋,因为这辆车有一个椭圆形——以前所未有的75.06英里每小时的速度行驶,打破了Camille Jenatzy于1899年创下的La Jamais Contente的纪录。 重点是,如今几乎任何人都可以以每小时75英里的速度驾驶,并且在喝咖啡或化妆时这样做。这意味着一百年前只有特技赛车手才能做到的事情现在是普遍实现的;以70英里每小时的速度驾驶不再是一项罕见的技能。这几乎是日常生活的要求。 但是令人惊讶的是:人类并没有花一百年的时间进化成赛车手。几乎每个人都可以在几个月的驾驶培训中学会如此快速驾驶。 人类拥有的惊人能力远远超出了喝咖啡时驾车的能力。因此,认为在100年后,每个人都会更像乔布斯,精通AI和量子计算,并表现出创新的基本人类能力,本质上是以每小时75英里的速度在信息高速公路上驾驶他们的大脑,而且甚至不会流一滴汗,这并不荒谬。 在社会层面,我们需要醒来并将我们的集体心态转变为胜利。我们需要重拾我们的集体战斗精神。如果我们都挖掘我们的勇气和韧性并承诺共同做这件事,那么没有什么是个人、公司、城市或国家做不到的。 让我们一起站起来,为我们的未来共同战斗。
Openai介绍了“主动” GPT-4 Turbo:负担得起的定价和增强型号
OpenAI继续引领人工智能领域,但公司并未放缓发展步伐,持续推出改进、升级乃至全新技术。最新一轮更新包括备受期待的变化,包括GPT-4 Turbo性能改进和更低的API成本。周四,OpenAI公布了一系列更新,其中包括更新后的GPT-4 Turbo预览版。尽管GPT-4 Turbo是OpenAI最先进的AI模型,但它曾因性能问题遭到诸多抱怨,包括被指责表现懒散。 此外,OpenAI还针对这一问题发布了更新后的GPT-4 Turbo预览模型gpt-4-0125-preview,相较于之前的模型,该模型在完成诸如代码生成等任务方面表现更佳。OpenAI表示,它甚至可以“减少模型未完成任务的‘懒散’情况。” 该公司还分享了备受期待的GPT-4 Turbo with Vision的最新进展,这将是OpenAI迄今为止最先进的模型,计划在未来几个月内推出普及版。 下周,OpenAI还将推出新的GPT-3.5 Turbo模型gpt-3.5-turbo-0125,据OpenAI介绍,该模型将具备“多种改进”,包括在按要求格式回应时的准确度更高,以及修复了非英语语言功能调用的文本编码错误。 GPT-3.5 Turbo的价格也将是过去一年中第三次下调,新模型的输入价格降低50%,至每1000个令牌0.0005美元,而输出价格降低25%,至每1000个令牌0.0015美元。 令牌被用作OpenAI的API执行任务的货币。完成任务所需的令牌数量取决于输入和输出的长度,如果使用ChatGPT处理较大的文本体,费用往往会迅速增加。价格下调应有助于抵消使用ChatGPT进行这些应用的成本。 最后一项更新是免费的Moderation API,开发者可以使用它来识别潜在有害的文本。OpenAI发布了其最强大的内容审查模型,text-moderation-007。 在新模型方面,OpenAI发布了两个新的嵌入模型:text-embedding-3-small模型和text-embedding-3-large模型。嵌入模型将文本、自然语言或代码表示为向量,有助于机器学习模型理解内容之间的关系。
2024年的顶级AI图像发生器
如果您曾经在谷歌上费尽心思寻找所需的图片却无果,AI可能会为您提供帮助。通过AI图像生成器,您可以输入详细或模糊的提示,以适应各种目的,并立即在屏幕上看到您想象中的图片。这些工具可以帮助品牌塑造、社交媒体内容创作、愿景板、邀请函、传单、贺卡等。 OpenAI的DALL-E 2因其先进的功能和作为首个主流AI图像生成器而引起了巨大关注。然而,自其首次发布以来,这一领域发生了许多发展。许多公司发布了能与DALL-E 2竞争的自己的模型,OpenAI甚至发布了更高级的模型,DALL-E 3。 为了帮助您弄清楚哪些模型最适合不同的任务,我通过将同一个提示——“两只约克夏犬坐在覆盖着雪的海滩上”——输入每个图像生成器来对其进行测试。以下是我发现的最佳AI图像生成器的汇总。 Image Creator from Microsoft Designer 特点:由DALL-E 3驱动 | 通过Copilot、浏览器、移动设备访问 | 输出:每个提示4张图片 | 价格:免费 优点:快速、免费、易于访问 缺点:需要Microsoft账号,处于预览阶段 DALL-E 2 特点:由OpenAI的DALL-E 2驱动 | 通过OpenAI网站访问 | 输出:每个信用4张图片 | 价格:如果在2023年4月6日之前注册则免费,之后注册则最低15美元 优点:快速、未受版权保护、准确的描绘 缺点:需要付费信用,需要创建账户 DreamStudio
Chatgpt vs Chatgpt Plus:评估订阅值
GPT-4,作为OpenAI最强大的语言模型之一,已经通过每月20美元的ChatGPT Plus订阅提供了数月。如果您在寻找对您的查询提供更准确答案、AI生成图像、网页浏览、数据分析以及在一个地方访问不同的GPT-4机器人,GPT-4已证明其优于公开可用的GPT-3.5。 GPT-4仍然可能犯错误,这些错误通常被称为幻觉。但如果您希望对一些具有挑战性的问题得到一些聪明的回答,GPT-4就是答案。考虑到这一点,这里有免费版本的ChatGPT和ChatGPT Plus中的付费版本GPT-4之间的技术差异。 如果您想要的不仅仅是文本回复,您应该使用ChatGPT Plus。GPT-4不仅比GPT-3.5强大,而且它还是多模态的,能够分析文本、图像和声音。例如,它可以接受一张图片作为提示并提供准确的文本回应,它可以生成图像,也可以通过声音进行交流,然后使用它的声音回应。 此外,ChatGPT Plus用户还可以上传文档供GPT-4分析并进行推断或总结。然而,GPT-4只会用文本回答你——除非你要求它为你生成一张图像。 用户可以要求GPT-4创建一个图像,它将利用DALL-E 3的能力来实现;无需切换到另一个网站。 如果您想使用自定义GPT机器人或插件,您也应该使用ChatGPT Plus。访问GPT Store和ChatGPT插件仅限于那些拥有Plus订阅的用户,因为您只能在使用GPT-4时使用它们。新的GPT商店是一个由GPT-4驱动的定制AI聊天机器人库,这些专业机器人结合了不同的技能、训练和自定义指令。 GPT机器人可以在特定数据上进行训练,并在商店中提供给其他人使用。您可以找到为解决数学方程提供逐步答案的机器人,如Math Solver;通过Finance Wizard了解股票市场;或者通过VEED的VideoGPT为社交媒体生成视频。 如果您正在寻找更加细腻和准确的回应,您也应该使用ChatGPT Plus。OpenAI将GPT-4描述为:“比它的前身GPT-3.5先进10倍。这种增强使得模型能够更好地理解上下文和区分细微差别,从而产生更准确和连贯的回应。” 如果您想要获取最新信息,免费版本的ChatGPT无法访问互联网,但ChatGPT Plus可以。OpenAI最近将“Browse with Bing”功能集成到GPT-4中,这意味着AI聊天机器人可以访问互联网并提供有关当前事件的信息。 如果您不需要额外的功能,您应该使用免费的ChatGPT。ChatGPT的免费版本已经是一个值得注意的力量,并且非常受欢迎。ChatGPT在发布两个月内就达到了1亿用户,这是在GPT-4公开发布和创建Plus订阅之前的几个月。 免费的ChatGPT可以生成文本摘要、故事、笑话、购物清单、代码、信件、时间表、简历、数学问题的解决方案等等——所有这些都无需订阅。此外,如果您宁愿通过ChatGPT移动应用程序对ChatGPT说话,OpenAI的自动语音识别系统Whisper也内置在ChatGPT移动应用程序中。Whisper将口语转换为书面文本。当您使用您的声音通过应用程序与ChatGPT交谈时,AI聊天机器人将以惊人的自然听起来的人声回应,从AI聊天机器人读取回应,这是免费版本ChatGPT现在包含的功能。 如果您宁愿免费使用它,无论ChatGPT Plus是否值得花钱是一个非常主观的问题。但是,如果您对是否升级到付费订阅持犹豫态度,您应该考虑使用Bing Chat功能,这是一个由GPT-4和DALL-E 3驱动的AI聊天机器人。 使用Bing Chat与使用ChatGPT Plus的体验相似,增加的好处是您不必支付费用就可以访问它。诚然,两个机器人的答案不同:Bing倾向于在不同站点的搜索结果上做文章,并将它们组合成几段话,而ChatGPT生成的回应读起来更自然。
Openai悄悄放弃了与公众共享重要文件的承诺
应WIRED的请求,OpenAI被要求根据其在美国国税局(IRS)文件中的承诺提供相关文件,最终由其非营利组织的法律顾问决定。他们拒绝提供这些文件,并采取了新政策,即不公开这些文件,这延续了自成立以来透明度不断减少的趋势。OpenAI曾经公布了有关其人工智能发明的详细信息,但最近对其最著名工具ChatGPT背后的技术细节和数据保密。公司发言人Felix表示,总部位于旧金山的OpenAI披露了IRS和加利福尼亚州总检察长所要求的所有材料,并定期发布其研究和安全工作信息,同时还以工具形式免费提供其研究成果,如ChatGPT。 自2019年非营利组织成立以来,OpenAI创造了一个盈利子公司,以容纳大部分的人工智能开发并吸引外部投资,其开放性显著下降。这为OpenAI提供了与微软这样的科技巨头合作的机会,而微软正是其成立初衷所要挑战的对象之一,这也使其财务状况变得隐蔽。OpenAI的联合创始人、现为竞争对手的埃隆·马斯克在11月的纽约时报活动中表示,他的前公司应该被称为“超级闭源最大利润AI”。 OpenAI最初的非营利组织及其董事会仍然对OpenAI的活动和技术拥有最终控制权。作为所有美国非营利组织一样,它必须在公开请求时提供其向IRS提交的年度报告副本,并在这些提交文件中指出是否有任何额外文件(如章程或类似文件、治理宪章或利益冲突政策)在过去一年对公众开放。一些著名的非营利组织确实这样做,例如比尔及梅琳达·盖茨基金会公布了其章程和关于利益冲突及工作场所关系的规则,但这并非标准做法。国家非营利组织理事会的首席运营和通信官Rick Cohen表示,“组织公开其管理文件或内部政策并不常见。” 然而,从成立之初到2022年的连续七年中,OpenAI在其年度IRS申报中声称,它会“根据请求”提供这些提交文件以及其他文件。但不清楚是否有人在2022年之前真正接受了OpenAI的邀请——OpenAI拒绝透露。去年12月,WIRED在等待OpenAI通信团队两天后,通过电子邮件请求其管理文件、利益冲突规则和财务报表,于12月14日在OpenAI旧金山总部外按响了门铃,要求查看所有这些文件。一位接待员通过对讲机表示这是不可能的,挂断电话后便没有再次联系。OpenAI在2023年的IRS申报,将反映其改变了之前的政策,但直到今年晚些时候才会提交。 为了鼓励对非营利组织的监督,美国税法要求它们至少在其办公室公开展示向IRS提交的年度报告(即990表格),如果这些报告没有在组织的网站上公布,则应在被请求的当天提供。OpenAI没有在其网站上发布报告,但当WIRED亲自到访时也没有提供这些报告。IRS的文件显示,违规者可能面临每天20美元的罚款,最高可达10,000美元,但IRS拒绝就OpenAI的情况发表评论,理由是税法的保密条款。OpenAI尚未被指控有不当行为,Felix表示,OpenAI的报告可以通过政府和研究数据库在线获取。
人类的“非ai创意艺术模式”正在接近您
在一个充斥着人工智能生成艺术的世界里,平面设计师Pablo Delcan想出了一个革命性的新工具: “第一个非人工智能生成艺术模型”。 “给我发送一个提示信息,“Delcan在12月初的一个俏皮Instagram帖子中邀请公众。“我将用黑墨水在纸上绘制一幅画,并发送给你。” 从那时起,他就一直在做这件事。到目前为止,他已经根据大约250个文本提示绘制了图画,这些提示在语气和长度上各不相同(简单地说,比如“雾”)。许多提示很荒谬:“一个对电脑感到沮丧的死神。““一个正在倒立的T-Rex。““一朵花生出一支铅笔。“一些则是诗意的(“由云彩构成的城市”)或私人的。“我有点沮丧,“其中一个最近的提交内容写道。“你能画一个可爱的女孩说‘你可以做到的。快起来,离开你温暖的毯子?’吗?” Delcan的非人工智能生成艺术模型的异想天开之作,名为Prompt-Brush,已经让观众们感到愉悦,以至于超过2700个提示正在他的在线队列中等待Delcan。 Delcan原籍西班牙,现居纽约,他设计书籍和书籍封面,并为《纽约时报》提供视觉内容。在艺术家们努力理解生成性人工智能工具对他们的工作和创造力本身的影响时,他正忙于将画笔置于纸上。 虽然这个项目最初是社交媒体平台上的一个玩笑,但这位设计师本月初推出了一个专门的Prompt-Brush 1.0网站,游客可以在该网站输入文本提示和电子邮件地址,以换取一幅免费的绘画。他们可以浏览到目前为止所制作的绘画目录,并扫描等待Delcan的人类触摸的提示。该网站还包含一个有趣的小教程,解释Delcan的旧时墨水画是如何制作的。 “使用画笔通过将其浸入黑墨水中,然后在一张纸上移动它来绘画,从而留下痕迹,“描述中写道。“轻触会产生细线,而较重的按压会产生粗线。通过连接这些线条,可以制作出各种各样的绘画。” 但是,尽管这个项目嘲笑了以提示为驱动的创造力的普遍性,Delcan表示,这与艺术和人工智能的辩论相比,更多的是出于他对它的热爱。“我最终对此更感兴趣,作为我自己的一个实验,“他在一次采访中说。“所有这些我一直在为人们绘制的画,每一幅都通过电子邮件发送给一个人,每一幅都投入了一些思考。我认为这是我与自己的作品之间经历过的最真实的交流和联系。” 在绘制图像后,Delcan用他的手机拍照,并在电脑上增加对比度,以获得干净、一致的黑白外观。 随着由人工智能辅助的创意工作的增多,一些艺术家对它所提供的创造性可能性感到兴奋,而其他人则担心他们的作品正在被未经许可、补偿或认可的情况下从互联网上抓取,用于训练人工智能数据集。许多创意工作者,包括Delcan在内,同时持有这两种观点,尽管Delcan更倾向于热情。“好处很多,“他说。“这是梦寐以求的助手,可以帮助生成草图和发展想法。也许我对这一切都太天真了,“他补充说,“但我认为,给任何人提供可以创造性地使用的强大工具是一件好事。另一个想法是,人工智能艺术生成器将赋予人类创造的图像、人类的想法和经历更多的价值。” 这位设计师平均每天绘制15张以提示为燃料的图像,但有时多达50张。它们通常需要一分钟来创建,更复杂的绘画需要两分钟,如果他绘制几个版本,可能需要五分钟。 尽管这项任务的速度很快,但向Prompt-Brush提交提示的人不应该期待立即得到回应。不像图像生成算法,人类艺术生成器Delcan需要偶尔休息喝咖啡,抓紧时间睡觉。
稳定破坏的创造者朝着语言建模发展
Stability AI,这家正在商业化Stable Diffusion的陷入困境的公司,正在加倍投入语言模型,试图扭转其命运。Stability公布了其“Stable LM 2”系列模型的首个模型。名为“Stable LM 2 1.6B”,这个首发模型仅有16亿参数,但它是一个强大的语言模型。Stable LM 2 1.6B接受了两万亿token的训练,历经两个epoch,即两次训练数据循环。它处理了包括英语、西班牙语和法语在内的七种语言的多语言数据。Stability的最新模型旨在降低硬件门槛,公司表示这将“让更多开发者参与到生成式AI生态系统中”。该模型在大多数任务上优于其他不足2B参数的模型,超越了微软的Phi-1.5、TinyLlama 1.1B和Falcon 1B等流行的较小系统。 Stability表示:“通过发布迄今为止最强大的小型语言模型之一,并在其训练细节上提供完全透明度,我们旨在赋予开发者和模型创造者快速实验和迭代的能力。”它推出了基础模型和经过指令调优的版本。还公布了数据细节和冷却前的最终预训练检查点,包括优化器状态,以帮助开发者更顺利地继续预训练和微调。 Stability在过去几个月一直在转向语言模型工作。去年12月,它发布了StableLM Zephyr 3B模型,而最初的StableLM则在九个月前推出。在面临投资者压力增大和财务问题的报道后,该公司似乎正在改变方向。去年11月有报道称该公司正在出售,据说Cohere和Jasper对收购该公司感兴趣。据报道,Stability在计算成本和工资上花费了数百万美元,而收入却只是一小部分。然而,据说该公司正专注于研发。 转向基于语言的系统将补充其图像和视频生成能力,同时使其与基于文本的模型提供商竞争。 Stable LM 2 1.6B既可用于商业用途,也可用于非商业用途 - 但商业用途需要Stability AI会员资格。非商业会员资格免费,但仅限于个人和研究用途。专业层级 - 针对年收入不超过100万美元、机构资金不超过100万美元和每月活跃用户不超过100万的创作者和开发者 - 每月20美元。超出这些规定的被视为企业级,需要与Stability进行谈判。 诚然,该模型确实展现了常见问题,如幻觉和输出有害语言的潜力。Stability表示,它希望社区“采取适当措施,确保他们在构建模型时负责任地开发”。
从稀树草原统治者到被追捕
从丛林之王到被猎者 长期以来,Google 在类似人工智能的系统上几乎拥有垄断地位。我之所以说是“类似人工智能”,是因为 Google 搜索非常类似于人工智能。你向它提出一个问题,Google 根据你的查询词、之前的搜索记录、浏览历史等来理解你的意图(即你想要什么),然后提供它认为包含答案的一些链接。 因此,为了回答你的搜索,Google 需要首先正确理解你的问题(例如,你是指苹果公司还是苹果这种水果?)。然后,基于这种理解以及 Google 自有的互联网地图(这是世界上最好、最完整的地图),它找到最有可能包含答案的互联网的那些部分。 所有这些都缺少的是(Google 几个月前开始做到这一点)利用返回链接中的信息,通过大型语言模型(LLM)生成自然语言答案。过去,Google 更倾向于让你点击链接并阅读,而不是直接生成答案。这并不是因为 Google 做不到,而是出于商业角度,它不想这么做。原因如下: 你在搜索结果中点击越多,Google 就能收集到更多关于你以及你对返回结果质量的看法的数据。这些数据帮助 Google 改进其搜索引擎,并更多地了解你(以便向你展示你更有可能点击的广告)。 如果它直接并显著地显示了你查询的答案,那么你查看(并点击)其他链接的理由就少得多了。但点击赞助链接(即伪装成链接的广告)是 Google 赚钱的重要方式之一。用链接间接回答你的问题迫使你花更多时间浏览搜索结果——而浏览的时间越长,你点击广告的可能性就越大。 嵌入式武器竞赛 除此之外,OpenAI、Facebook 和其他人工智能公司已经开始了一场嵌入式武器竞赛。嵌入式是一串数字(也称为向量),它编码了一个句子或段落的含义,以便计算机……