Posted on 21/06/2023, 19:15 By zgzsur

¿Qué es ChatGPT y cómo puedes usarlo?

Esto es ChatGPT y por qué puede ser la herramienta más importante desde los motores de búsqueda modernos

OpenAI introdujo una IA de respuesta a preguntas de formato largo llamada ChatGPT que responde preguntas complejas de forma conversacional.

Es una tecnología revolucionaria porque está entrenada para aprender lo que los humanos quieren decir cuando hacen una pregunta.

Muchos usuarios están asombrados por su capacidad para proporcionar respuestas de calidad humana, lo que inspira la sensación de que eventualmente puede tener el poder de interrumpir la forma en que los humanos interactúan con las computadoras y cambiar la forma en que se recupera la información.

¿Qué es ChatGPT?

ChatGPT es un chatbot de modelo de lenguaje grande desarrollado por OpenAI basado en GPT-3.5. Tiene una capacidad notable para interactuar en forma de diálogo conversacional y proporcionar respuestas que pueden parecer sorprendentemente humanas.

Los modelos de lenguaje grande realizan la tarea de predecir la siguiente palabra en una serie de palabras.

El aprendizaje por refuerzo con retroalimentación humana (RLHF) es una capa adicional de capacitación que utiliza la retroalimentación humana para ayudar a ChatGPT a aprender la capacidad de seguir instrucciones y generar respuestas que sean satisfactorias para los humanos.

¿Quién creó ChatGPT?

ChatGPT fue creado por la empresa de inteligencia artificial OpenAI, con sede en San Francisco. OpenAI Inc. es la empresa matriz sin fines de lucro de OpenAI LP con fines de lucro.

OpenAI es famoso por su conocido DALL·E, un modelo de aprendizaje profundo que genera imágenes a partir de instrucciones de texto llamadas avisos.

El CEO es Sam Altman, quien anteriormente fue presidente de Y Combinator.

Microsoft es socio e inversionista por un monto de $1 billón de dólares. Desarrollaron conjuntamente Azure AI Platform .

Modelos de lenguaje grande

ChatGPT es un modelo de lenguaje grande (LLM). Los modelos de lenguaje grande (LLM) se entrenan con cantidades masivas de datos para predecir con precisión qué palabra viene a continuación en una oración.

Se descubrió que aumentar la cantidad de datos aumentaba la capacidad de los modelos de lenguaje para hacer más.

Los LLM predicen la siguiente palabra en una serie de palabras en una oración y las siguientes oraciones, algo así como autocompletar, pero en una escala alucinante.

Esta habilidad les permite escribir párrafos y páginas enteras de contenido.

Pero los LLM están limitados porque no siempre entienden exactamente lo que quiere un ser humano.

Y ahí es donde ChatGPT mejora el estado del arte, con el entrenamiento de Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF) mencionado anteriormente.

¿Cómo se entrenó ChatGPT?

GPT-3.5 fue entrenado en cantidades masivas de datos sobre código e información de Internet, incluidas fuentes como discusiones de Reddit, para ayudar a ChatGPT a aprender a dialogar y lograr un estilo humano de respuesta.

ChatGPT también fue entrenado usando retroalimentación humana (una técnica llamada Aprendizaje de refuerzo con retroalimentación humana) para que la IA aprendiera lo que los humanos esperaban cuando hacían una pregunta. Entrenar al LLM de esta manera es revolucionario porque va más allá de simplemente entrenar al LLM para predecir la siguiente palabra.

“Este trabajo está motivado por nuestro objetivo de aumentar el impacto positivo de los grandes modelos de lenguaje entrenándolos para que hagan lo que un grupo determinado de humanos quiere que hagan.

De forma predeterminada, los modelos de lenguaje optimizan el objetivo de predicción de la siguiente palabra, que es solo un indicador de lo que queremos que hagan estos modelos.

Nuestros resultados indican que nuestras técnicas son prometedoras para hacer que los modelos de lenguaje sean más útiles, veraces e inofensivos.

Hacer que los modelos de lenguaje sean más grandes no los hace inherentemente mejores para seguir la intención del usuario.

Por ejemplo, los modelos de lenguaje extenso pueden generar resultados falsos, tóxicos o simplemente no útiles para el usuario.

En otras palabras, estos modelos no están alineados con sus usuarios”.

Los ingenieros que construyeron ChatGPT contrataron a contratistas (llamados etiquetadores) para calificar los resultados de los dos sistemas, GPT-3 y el nuevo InstructGPT (un “modelo hermano” de ChatGPT).

Con base en las calificaciones, los investigadores llegaron a las siguientes conclusiones:

“Los etiquetadores prefieren significativamente las salidas de InstructGPT a las salidas de GPT-3.

Los modelos InstructGPT muestran mejoras en la veracidad sobre GPT-3.

InstructGPT muestra pequeñas mejoras en la toxicidad sobre GPT-3, pero no sesgo”.

El trabajo de investigación concluye que los resultados de InstructGPT fueron positivos. Aún así, también señaló que había margen de mejora.

“En general, nuestros resultados indican que el ajuste fino de los modelos de lenguaje grandes que utilizan las preferencias humanas mejora significativamente su comportamiento en una amplia gama de tareas, aunque queda mucho trabajo por hacer para mejorar su seguridad y confiabilidad”.

Lo que diferencia a ChatGPT de un simple chatbot es que fue entrenado específicamente para comprender la intención humana en una pregunta y proporcionar respuestas útiles, veraces e inofensivas.

Debido a esa capacitación, ChatGPT puede desafiar ciertas preguntas y descartar partes de la pregunta que no tienen sentido.

Otro trabajo de investigación relacionado con ChatGPT muestra cómo entrenaron a la IA para predecir lo que preferían los humanos.

Los investigadores notaron que las métricas utilizadas para calificar los resultados de la IA de procesamiento de lenguaje natural dieron como resultado máquinas que obtuvieron buenos puntajes en las métricas, pero no se alinearon con lo que los humanos esperaban.

Así es como los investigadores explicaron el problema:

“Muchas aplicaciones de aprendizaje automático optimizan métricas simples que son solo indicadores aproximados de lo que pretende el diseñador. Esto puede generar problemas, como las recomendaciones de YouTube que promueven el clickbait”.

Entonces, la solución que diseñaron fue crear una IA que pudiera generar respuestas optimizadas según las preferencias de los humanos.

Para hacer eso, entrenaron a la IA utilizando conjuntos de datos de comparaciones humanas entre diferentes respuestas para que la máquina fuera mejor en la predicción de lo que los humanos consideraban respuestas satisfactorias.

El periódico comparte que la capacitación se realizó resumiendo las publicaciones de Reddit y también probó resumiendo las noticias.

¿Cuáles son las limitaciones de ChatGPT?

Limitaciones en la respuesta tóxica

ChatGPT está específicamente programado para no proporcionar respuestas tóxicas o dañinas. Por lo tanto, evitará responder ese tipo de preguntas.

La calidad de las respuestas depende de la calidad de las instrucciones

Una limitación importante de ChatGPT es que la calidad de la salida depende de la calidad de la entrada. En otras palabras, las indicaciones de expertos (indicaciones) generan mejores respuestas.

Las respuestas no siempre son correctas

Otra limitación es que debido a que está capacitado para proporcionar respuestas que los humanos sienten bien, las respuestas pueden engañar a los humanos de que la salida es correcta.

Muchos usuarios descubrieron que ChatGPT puede proporcionar respuestas incorrectas, incluidas algunas que son tremendamente incorrectas.

Los moderadores del sitio web de preguntas y respuestas de codificación Stack Overflow pueden haber descubierto una consecuencia no deseada de las respuestas que parecen correctas para los humanos.

Stack Overflow se inundó con las respuestas de los usuarios generadas desde ChatGPT que parecían ser correctas, pero muchas eran respuestas incorrectas.

Las miles de respuestas abrumaron al equipo de moderadores voluntarios, lo que llevó a los administradores a promulgar una prohibición contra cualquier usuario que publique respuestas generadas desde ChatGPT.

La experiencia de los moderadores de Stack Overflow con respuestas incorrectas de ChatGPT que parecen correctas es algo que OpenAI, los creadores de ChatGPT, conocen y advierten en su anuncio de la nueva tecnología.

OpenAI explica las limitaciones de ChatGPT

El anuncio de OpenAI ofreció esta advertencia:

“ChatGPT a veces escribe respuestas que suenan plausibles pero incorrectas o sin sentido.

Resolver este problema es un desafío, ya que:

(1) durante el entrenamiento de RL, actualmente no hay una fuente de verdad;

(2) entrenar al modelo para que sea más cauteloso hace que rechace preguntas que puede responder correctamente; y

(3) el entrenamiento supervisado engaña al modelo porque la respuesta ideal depende de lo que sabe el modelo, en lugar de lo que sabe el demostrador humano”.

¿ChatGPT es de uso gratuito?

El uso de ChatGPT actualmente es gratuito durante el tiempo de “vista previa de investigación”.

El chatbot está actualmente abierto para que los usuarios prueben y brinden comentarios sobre las respuestas para que la IA pueda mejorar al responder preguntas y aprender de sus errores, con lo que nos están usando como conejillos de indias o betatesters regalados.

El anuncio oficial establece que OpenAI está ansioso por recibir comentarios sobre los errores:

“Si bien nos hemos esforzado para que el modelo rechace solicitudes inapropiadas, a veces responderá a instrucciones dañinas o exhibirá un comportamiento sesgado.

Estamos utilizando la API de moderación para advertir o bloquear ciertos tipos de contenido no seguro, pero esperamos que tenga algunos falsos negativos y positivos por ahora.

Estamos ansiosos por recopilar comentarios de los usuarios para ayudar en nuestro trabajo continuo para mejorar este sistema”.

Actualmente hay un concurso con un premio de $500 en créditos de ChatGPT para alentar al público a calificar las respuestas.

“Se alienta a los usuarios a proporcionar comentarios sobre los resultados del modelo problemático a través de la interfaz de usuario, así como sobre los falsos positivos/negativos del filtro de contenido externo que también forma parte de la interfaz.

Estamos particularmente interesados en recibir comentarios sobre resultados dañinos que podrían ocurrir en condiciones no adversas del mundo real, así como comentarios que nos ayuden a descubrir y comprender riesgos novedosos y posibles mitigaciones.

Puede optar por participar en el Concurso de comentarios de ChatGPT3 para tener la oportunidad de ganar hasta $500 en créditos API.

Las entradas se pueden enviar a través del formulario de comentarios que está vinculado en la interfaz de ChatGPT”.

El concurso actualmente en curso finaliza a las 11:59 p. m. PST del 31 de diciembre de 2022.

¿Los modelos de lenguaje reemplazarán la búsqueda de Google?

Dado que estos grandes modelos de lenguaje pueden responder tantas preguntas, ¿es descabellado que una empresa como OpenAI, Google o Microsoft algún día reemplace la búsqueda tradicional con un chatbot de IA?

Algunos en Twitter ya están declarando que ChatGPT será el próximo Google.

El escenario de que un chatbot de preguntas y respuestas pueda algún día reemplazar a Google es aterrador para aquellos que se ganan la vida como profesionales del marketing de búsqueda.

Habiendo probado ChatGPT, debo aceptar que el temor de que la búsqueda sea reemplazada por un chatbot no es infundado.

La tecnología aún tiene un largo camino por recorrer, pero es posible imaginar un futuro híbrido de búsqueda y chatbot para la búsqueda.

Pero la implementación actual de ChatGPT parece ser una herramienta que, en algún momento, requerirá la compra de créditos para usar.

¿Cómo se puede usar ChatGPT?

ChatGPT puede escribir código, poemas, canciones e incluso cuentos al estilo de un autor específico.

La experiencia en el seguimiento de instrucciones eleva a ChatGPT de una fuente de información a una herramienta a la que se le puede pedir que realice una tarea.

Esto lo hace útil para escribir un ensayo sobre prácticamente cualquier tema.

ChatGPT puede funcionar como una herramienta para generar esquemas para artículos o incluso novelas completas.

Proporcionará una respuesta para prácticamente cualquier tarea que pueda responderse con texto escrito.

Conclusión

ChatGPT será una herramienta que el público tendrá que pagar.

Quieren acceder a TODA la información sobre chat gpt ? … CLICK HERE

About zgzsur

Categories: Inteligencia Artificial Etiquetas: Chatg GPT