Tento model AI byl vyvinut na bázi GPT-4 a slouží ke kontrole a kritice výsledků ChatGPT. Cílem je zlepšit kvalitu výstupů generovaných modely AI a zajistit tak uživatelům v budoucnu ještě spolehlivější výsledky.
Jak CriticGPT funguje?
CriticGPT byl vyškolen k identifikaci chyb ve výstupním kódu ChatGPT. Analyzuje výsledky vygenerované modelem ChatGPT a odhaluje případné nedostatky nebo nepřesnosti.
Podle společnosti OpenAI jsou uživatelé s podporou CriticGPT až o 60 % efektivnější při odhalování chyb ve výstupech ChatGPT než bez tohoto nástroje.
Základem GPT-4, jádra ChatGPT, je tzv. Reinforcement-Learning from Human Feedback (RLHF), neboli učení se na základě zpětné vazby od člověka. Přitom se model umělé inteligence učí na základě lidské zpětné vazby, aby optimalizoval své odpovědi tak, aby byly užitečnější a interaktivnější.
Limity CriticGPT
CriticGPT je stále ve fázi vývoje, a proto není zcela zralý. Nástroj byl zatím trénován na relativně krátkých odpovědích ChatGPT, a není tedy ještě schopen plně zachytit delší a složitější úlohy.
Kromě toho má CriticGPT v současné době stále problémy s identifikací chyb, které zasahují do více částí odpovědi. Problémy pro nástroj představují také složité úlohy nebo odpovědi.
Zdroj: OpenAI