ChatGPT
ChatGPT es un chatbot de intelligence artificial (IA) developpate per OpenAI e lanciate in novembre 2022. Illo es construite super le familias de modelos de linguage grande (LLM) GPT-3.5 e GPT-4 de OpenAI e ha essite refine (un approcio de apprentimento transferite) usando technicas de apprentimento supervisate e de reinforcement.
ChatGPT ha essite lanciate como un prototipo le 30 de novembre 2022. Ille ha attirate attention pro su responsas detallate e articulate a traverso de multe domines de cognoscentia. Su precision factual nonuniforme, tamen, ha essite identificate como un drawback significative.[4] Sequente le lanciamento de ChatGPT, le valuation de OpenAI ha essite estimate a $29 billion in 2023.
Le version original de ChatGPT se basava super GPT-3.5. Un version basate super GPT-4, le plus nove modelo de OpenAI, ha essite lanciate le 14 de martio 2023 e es disponibile pro abonatos pagante in un base limitate.
Entrenamento
modificarChatGPT es un membro del familia de modelos de lingua pre-entrenate generative transformer (GPT). Illo esseva fine-tunate (un approcha de transfer learning) super un version meliorate de OpenAI GPT-3 cognoscite como "GPT-3.5".
Le processo de fine-tunation utilisava tanto learning supervise como learning de reinforcement in un processo cognoscite como "reinforcement learning from human feedback (RLHF)". Ambos approchas usava formatores human pro meliorar le prestation del modelo. In le caso de learning supervise, le modelo esseva provide con conversationes in le quales le formatores ludava ambos le rol del usator e le assistantia AI. In le phase de learning de reinforcement, le formatores human initialmente classificava responsas que le modelo habeva create in conversationes previe. Istes classificationes esseva usate pro crear "models de recompensa" que esseva usate pro fine-tunar le modelo ulteriormente per medio de varie iterationes de Proximal Policy Optimization (PPO). Le algorithmos de optimation de politicas proxime es un alternativa rentabile a le algorithmos de optimation de politicas de regiones de confidentia.
Inicialmente, ChatGPT usava un infrastructura de supercomputing Microsoft Azure, con GPUs de Nvidia, que Microsoft habeva construite specificamente pro OpenAI e que costava "centenas de milliones de dollars", secundo reportos. Post le successo de ChatGPT, Microsoft meliorava dramaticamente le infrastructura de OpenAI in 2023.
OpenAI collige datos de usatores de ChatGPT pro trainar e fine-tunar le servicio ulteriormente. Le usatores pote votar pro o contra le responsas que illes recive de ChatGPT e completar un campo de texto con retroactione addicional.