其实大部分的模型的基础语料可能都有互相抄的情况,但是这样被抓出来放在新闻上还是头一遭。
其实这事不仅字节在干,各大模型厂家都在这么干,甚至GOOGLE的中文语料也是从文心一言°那里拿的...…例如我下面举例的图片,我用POE的Gemini-pro问它是什么模型,它的回答是文心一言,这说明基础语料大家都是抄抄抄。
见:https://gugehome.com/am.php?t=Fnlvhb5eS9VJ
很多人估计对于这个争端云里雾里的。
其实是这样的,OpenAI提供两种服务,一种就是最常见的ChatGPT,直接给你一个对话框,你可以跟ChatGPT进行各种各样的对话,其中服务分为网页端和手机端,效果几乎没有差别。 [图片] 另一种就是API服务,这个理解起来会比较复杂,比如说你想吃沙县小吃,就有两种方法,第一你可以直接去沙县小吃店吃做好的,第二种是沙县小吃把各种需要的材料和做法打包发给你,你可以自己做着吃,你也可以自己加点别…
如何看字节跳动使用 OpenAI 技术开发自家 AI 大模型 ?
其实“GPT”的数量是三个,不是两个。除了OpenAI自己的ChatGPT网页端和GPT API之外,微软也在通过Azure提供API服务,包括国内大厂在内的全球各个大型企业采购的都是微软的服务。按照字节自己的声明,“从微软获得GPT授权”的意思就是采购微软服务,跟微软签合同,理论上与OpenAI无关。
采购微软服务主要是因为微软一直是B端市场的头部玩家,跟各个大客户都有现成的商务合作关系(采购Windows和Office等产品的批量授权),对接起来比较简单。而且OpenAI孱弱的基础设施完全无法支撑大规模企业级的需求。在我们这边整个集团所有产研部门(包括内网的聊天页面)的月消耗量,每个月1W美元还不够塞牙缝的,而字节也一定会比我们更多。而且由于信息安全原因,企业员工按道理说是不应该直接使用公开的GPT服务的——我们这边公司网安甚至直接封锁了整个