Однако LLM общего назначения такие, как ChatGPT от OpenAI, обучаются на общедоступных данных и не оптимизированы для клинического использования (5). Это означает, что ответы общедоступных LLM на клинические вопросы, могут включать неверную, неполную или галлюцинаторную информацию (6, 7).
В настоящее время существуют три основных подхода, позволяющих «специализировать» LLM:
- Точная настройка исходной модели LLM, которая требует больших вычислительных затрат.
- Подсказки в LLM. При этом обрабатываются только небольшие объемы данных и необходим итеративный ввод данных пользователем.
- Поисково-дополненная генерация (Retrieval Augmented Generation, RAG), которая расширяет возможности LLM путем добавления системы поиска информации, предоставляющей внешние данные, которые затем дополняют и ограничивают результаты LLM.
RAG — это метод работы с большими языковыми моделями, когда пользователь пишет свой вопрос, а вы программно к этому вопросу «подмешиваете» дополнительную информацию из каких-то внешних источников и подаете все целиком на вход языковой модели. Другими словами, вы добавляете в контекст запроса к языковой модели дополнительную информацию, на основе которой языковая модель может дать пользователю более полный и точный ответ (8).
Одной из перспективных областей применения LLM является продвижение доказательной медицины через создание систем поддержки принятия врачебных решений, основанных на клинических рекомендациях, которые являются обобщением мнений экспертов и данных клинических исследований, и используются для улучшения результатов лечения пациентов через лучшие практики.
На сегодняшний день опубликован ряд исследований, посвященных использованию RAG и клинических рекомендаций для повышения точности ответов на медицинские вопросы. Одно из них посвящено нефрологии, где в основу были положены рекомендации по лечению хронических заболеваний почек (9). Два исследования касались патологии печени (10, 11). Еще в одном – LLM была дополнена возможностями поиска медицинских руководств и рекомендаций по лечению на тщательно подобранных медицинских интернет-ресурсах (12). Данные исследования продемонстрировали высокую точность ответов на вопросы, что говорит о возможности использования RAG с целью настройки LLM для клинического использования.
С клинических рекомендаций логично начинается, но отнюдь не заканчивается формирование медицинских баз знаний. В рамках использования RAG базы знаний могут пополняться пользователями в соответствии с их задачами. Это ведет к созданию обширной базы знаний по специальности, которая может быть положена в основу точной настройки исходной LLM с созданием цифрового двойника специалиста. Подобные примеры уже имеются в других отраслях.
Например, цифровой двойник агронома — это инновационный инструмент для эффективного сбора, анализа и моделирования сельскохозяйственных данных. Он предоставляет ответы на широкий спектр вопросов в сфере сельского хозяйства: рекомендации по питанию и выращиванию растительных культур, способы внедрения и точную дозировку минеральных удобрений и обработки посевов, распознает болезни растений по их изображению и т. д. (13).
Цифровой двойник хирурга может стать незаменимым компонентом цифровой операционной, обеспечивая информационную поддержку врача в процессе выполнения хирургического вмешательства. В перспективе этот инструмент может не только дополнить консультацию более опытного коллеги или хирурга другой специальности, но и проактивно давать врачу подсказки и рекомендации, основанные на обобщенном мировом опыте.
Прототип подобного инструмента был продемонстрирован компанией Theator на LSI USA ’23 (14) (рис. 1). Для помощи хирургу в принятии интраоперационного решения на монитор в режиме реального времени выводились прогнозируемые последствия того или иного решения для непосредственных и отделенных результатов лечения пациента.