Unpublished conference/Abstract (Scientific congresses and symposiums)
Principes généraux d'intelligence artificielle & Expériences de traduction texte-image-texte avec GPT-4 et DALL•E 3
Deliège, Adrien
2024 • Séminaire international de sémiotique à Paris : Énonciation(s) et passions dans les territoires sémiotiques ouverts par l’Intelligence Artificielle
[fr] Qu’est-ce que l’intelligence artificielle ? Comment crée-t-on une intelligence artificielle ? Comment fonctionnent des modèles génératifs d’images tels que DALL•E 3 ou de textes comme GPT-4 ? Dans cette présentation, nous répondrons à ces questions en adoptant le point de vue « de l’ingénieur ». Nous regarderons techniquement, mais sans entrer dans les détails mathématiques, quels processus sont à l’œuvre dans l’IA actuelle, afin de souligner les différentes absorptions et transformations des données, images, prompts au sein des modèles. Ensuite, nous étudierons quelques exemples de remaniement de prompts effectués par GPT-4 en amont de la génération d’images par DALL•E 3 sur le thème de Suzanne et les Vieillards. Finalement, nous tâcherons de déterminer quelques forces et faiblesses de GPT-4V, un puissant modèle traduisant une image donnée en une description textuelle.
Research center :
Traverses - ULiège [BE]
Disciplines :
Computer science Engineering, computing & technology: Multidisciplinary, general & others Art & art history
Principes généraux d'intelligence artificielle & Expériences de traduction texte-image-texte avec GPT-4 et DALL•E 3
Publication date :
14 February 2024
Event name :
Séminaire international de sémiotique à Paris : Énonciation(s) et passions dans les territoires sémiotiques ouverts par l’Intelligence Artificielle
Event place :
Paris, France
Event date :
14 février 2024
By request :
Yes
Audience :
International
References of the abstract :
Qu’est-ce que l’intelligence artificielle ? Comment crée-t-on une intelligence artificielle ? Comment fonctionnent des modèles génératifs d’images tels que DALL•E 3 ou de textes comme GPT-4 ? Dans cette présentation, nous répondrons à ces questions en adoptant le point de vue « de l’ingénieur ». Nous regarderons techniquement, mais sans entrer dans les détails mathématiques, quels processus sont à l’œuvre dans l’IA actuelle, afin de souligner les différentes absorptions et transformations des données, images, prompts au sein des modèles. Ensuite, nous étudierons quelques exemples de remaniement de prompts effectués par GPT-4 en amont de la génération d’images par DALL•E 3 sur le thème de Suzanne et les Vieillards. Finalement, nous tâcherons de déterminer quelques forces et faiblesses de GPT-4V, un puissant modèle traduisant une image donnée en une description textuelle.
Funders :
F.R.S.-FNRS - Fonds de la Recherche Scientifique [BE]