Když jedna AI kontroluje druhou: OpenAI představuje CriticGPT

Josef Mika 29.06.2024

Společnost OpenAI, vývojář populárního jazykového modelu ChatGPT, představil nový nástroj s názvem CriticGPT. Měl by kontrolovat a kritizovat svůj AI protějšek, čímž pomůže k jeho zdokonalení.

Kapitoly článku

Jak CriticGPT funguje?
Limity CriticGPT

Tento model AI byl vyvinut na bázi GPT-4 a slouží ke kontrole a kritice výsledků ChatGPT. Cílem je zlepšit kvalitu výstupů generovaných modely AI a zajistit tak uživatelům v budoucnu ještě spolehlivější výsledky.

Jak CriticGPT funguje?

CriticGPT byl vyškolen k identifikaci chyb ve výstupním kódu ChatGPT. Analyzuje výsledky vygenerované modelem ChatGPT a odhaluje případné nedostatky nebo nepřesnosti.

Podle společnosti OpenAI jsou uživatelé s podporou CriticGPT až o 60 % efektivnější při odhalování chyb ve výstupech ChatGPT než bez tohoto nástroje.

Základem GPT-4, jádra ChatGPT, je tzv. Reinforcement-Learning from Human Feedback (RLHF), neboli učení se na základě zpětné vazby od člověka. Přitom se model umělé inteligence učí na základě lidské zpětné vazby, aby optimalizoval své odpovědi tak, aby byly užitečnější a interaktivnější.

Mohlo by vás zajímat

Microsoft má problém: kvůli jeho umělé inteligenci trpí ekologie

Novinky

Limity CriticGPT

CriticGPT je stále ve fázi vývoje, a proto není zcela zralý. Nástroj byl zatím trénován na relativně krátkých odpovědích ChatGPT, a není tedy ještě schopen plně zachytit delší a složitější úlohy.

Kromě toho má CriticGPT v současné době stále problémy s identifikací chyb, které zasahují do více částí odpovědi. Problémy pro nástroj představují také složité úlohy nebo odpovědi.

Zdroj: OpenAI