RAG в offshore-индустрии: 1 ТБ данных, 4 провала и 184 евро аренды GPU

Инженер Andros Fenollosa опубликовал подробный разбор построения внутреннего RAG-сервиса для компании из offshore-индустрии. Внутри: локальная LLM, база...

Дата загрузки:02.06.2026 11:09:38

RAG в offshore-индустрии: 1 ТБ данных, 4 провала и 184 евро аренды GPU

02.06.2026
RAG в offshore-индустрии: 1 ТБ данных, 4 провала и 184 евро аренды GPU

Инженер Andros Fenollosa опубликовал подробный разбор построения внутреннего RAG-сервиса для компании из offshore-индустрии. Внутри: локальная LLM, база технической документации и проектов почти за десять лет, требование давать ответы со ссылками на первоисточники.

Кейс интересен не тем, что RAG собрали, а тем, на каких этапах система ломалась и во что в итоге превратилась архитектура.

Старт: стандартная связка

Начальная связка выглядела стандартно: Локальная модель — Ollama Эмбеддинги — nomic-embed-text Оркестратор — LlamaIndex Язык — Python

На прототипе из небольшого набора документов все работало за пару недель. Проблемы начались при столкновении с реальными данными — 1 ТБ разнородного контента без структуры: технические отчеты, регламенты, CSV, видео, симуляции, бэкапы, архивы.

Провал 1: память

 Проблема: LlamaIndex пытался обрабатывать все подряд, включая многогигабайтные видео и файлы симуляций, загружая их в RAM как текст.

 Решение: агрессивный фильтр на уровне пайплайна:

исключение по расширениям и паттернам имён (видео, исполняемые файлы, архивы, бэкапы, временные файлы, почтовые архивы), отказ от индексации CSV и JSON

Результат: сокращение набора на 54% и стабильная обработка без переполнения памяти.

Провал 2: масштаб индексации

Проблема: дефолтное хранение индекса в JSON-файле на диске не выдерживало сотен гигабайт. Любой перезапуск означал переиндексацию с нуля, checkpoint-механика давала повреждённые данные.

Решение: переход на выделенную векторную БД — ChromaDB поверх SQLite. Индексация превратилась из монолитного процесса в пакетный пайплайн по 150 файлов, с чекпоинтами и устойчивостью к сбоям.

Результат: 738 470 векторов, 54 ГБ индекса из исходных 451 ГБ документов.

Провал 3: железо

Проблема: на интегрированной графике обработка 500 МБ занимала 4–5 часов.

Решение: аренда виртуальной машины с NVIDIA RTX 4000 SFF Ada на 20 ГБ VRAM.

Результат: полная индексация заняла от 2 до 3 недель, счет за аренду — 184 евро, после этого SQLite-файл ChromaDB просто скопировали на production-сервер.

Провал 4: хранение

Проблема: production-VM имела 100 ГБ диска, тогда как исходные документы занимали около 500 ГБ.

Решение: оригиналы оставили в Azure Blob Storage, ссылки в ответах LLM формируются через SAS-токены для прямой загрузки пользователем из облака на локальном диске остались только индекс (54 ГБ), сама модель (10 ГБ) и легкие бэкенд и фронтенд на Flask и Streamlit

Ключевой вывод автора

Если исходные данные недостаточно качественные, никакая LLM не компенсирует этого в ответах.

Этот тезис хорошо согласуется с практикой: в production-RAG основная инженерная работа приходится не на выбор модели или фреймворка, а на: фильтрацию источников, нормализацию форматов, устойчивый пайплайн индексации, разделение слоев хранения (векторный индекс vs оригинальные документы).

Архитектурные решения здесь диктуются не возможностями LLM, а ограничениями памяти, диска, GPU и экономикой облачной аренды.

Что важно вынести из кейса

Кейс полезен тем, что показывает реальную дистанцию между демо-RAG на ноутбуке и сервисом, с которым ежедневно работают инженеры.

Эта дистанция измеряется не качеством модели, а дисциплиной работы с данными и инфраструктурой.


По материалам телеграм-канала

Новости госзаказа

13.06.2026
Товары из «Пятёрочки» хотят доставлять дронами.
X5 Digital изучает возможность запуска беспилотной доставки заказов из сетей «Пятёрочка», «Перекрёсток» и «Чижик». Сейчас компания ищет партнёра с готовым SaaS/PaaS-решением: не просто дроны, а полноценный сервис - оборудование, софт, поддержка и интеграция в ИТ-системы ритейлера. Главным сценарием должна стать доставка в частный сектор и посёлки, где обычные курьеры работают нерентабельно или их просто нет. Согласно техзаданию на сайт закупок, компания рассчитывает на следующие параметры: перевозка...
13.06.2026
Границы морского порта Корсаков на Сахалине будут расширены
В границы морского порта Корсаков, расположенного на побережье острова Сахалин, войдут дополнительные земельные участки и участок акватории, необходимые для строительства и эксплуатации новых объектов инфраструктуры.На присоединенных участках планируется создание: многофункционального грузового района, угольного, нефтяного и бункеровочного терминалов, терминала перевалки газового конденсата, подводных сооружений и других объектов портовой инфраструктуры.Порт связан регулярными линиями с Курильскими...
13.06.2026
Сила электричества
С токами высокой частоты имел дело каждый, кто пользовался микроволновкой. Кроме этого, высокочастотная обработка применяется в закалке металлических изделий, сварке пластмасс, склеивании фанеры, сушке макарон, сельском хозяйстве, медицине и много где ещё.Пионерами использования высокочастотных токов стали отечественные изобретатели Валентин Вологдин и Александр Фогель. 90 лет назад они создали первое в стране устройство для поверхностной закалки изделий электротоком.Об эффективности технологии...
13.06.2026
Границы морского порта Корсаков на Сахалине будут расширены
В границы морского порта Корсаков, расположенного на побережье острова Сахалин, войдут дополнительные земельные участки и участок акватории, необходимые для строительства и эксплуатации новых объектов инфраструктуры.На присоединенных участках планируется создание: многофункционального грузового района, угольного, нефтяного и бункеровочного терминалов, терминала перевалки газового конденсата, подводных сооружений и других объектов портовой инфраструктуры.Порт связан регулярными линиями с Курильскими...
13.06.2026
Индия (да и вообще Южная Азия) ничего серьёзного из себя в футбольном плане не представляет — и в обозримом будущем представлять не будет
Индия (да и вообще Южная Азия) ничего серьёзного из себя в футбольном плане не представляет — и в обозримом будущем представлять не будет. Посему на начавшемся чемпионате мира подписчикам этого канала логичнее всего будет болеть за Узбекистан — родной край падишаха Бабура, основателя могольской империи.
12.06.2026
Вручение медалей Героя Труда и Государственных премий Российской Федерации
В День России в Георгиевском зале Большого Кремлёвского дворца состоялась традиционная церемония вручения золотых медалей Героя Труда и Государственных премий в области науки и технологий, литературы и искусства, за выдающиеся достижения в правозащитной и благотворительной деятельности за 2025 год.Среди награждённых – актриса М.Неёлова, режиссёр А.Кончаловский, ректор МГУ В.Садовничий, бывший Уполномоченный по правам человека Т.Москалькова, главный врач больницы святителя Алексия А.Заров.
12.06.2026
Поздравление Михаила Мишустина с Днем России
Среди значимых дат в истории Отечества этот праздник занимает особое место для тех, кто беззаветно предан своей стране, кто ежедневно трудится на ее благо, отстаивает национальные интересы, укрепляет экономический потенциал и технологический суверенитет, сохраняет и приумножает бесценное наследие предыдущих поколений.Многонациональность и культурное разнообразие нашего государства формируют уникальное пространство, где звучат разные языки, переплетаются традиции и всех нас объединяет любовь к Родине...
04.06.2026
Инфраструктурный саммит пройдет в Москве 3 июля

3 июля состоится Инфраструктурный саммит «Сильная Россия» (InfraSpace) – традиционное место встречи представителей органов власти, инвесторов, застройщиков, девелоперов, подрядчиков, проектировщиков, дорожников, производителей стройматериалов, ИТ-компаний, финансового сектора и всех, кто отвечает за инфраструктурное развитие страны.

 

03.06.2026
Технологический суверенитет и экономика ИИ: итоги форума «ИИ — будущее сегодня» в Санкт-Петербурге

«Важно, чтобы ИИ внедрялся системно — через измеримые показатели, ответственность за результат и оценку достигнутого эффекта», — с таким заявлением 2 июня в Санкт-Петербурге на III Международном форуме «ИИ — будущее сегодня» выступил директор Центра развития искусственного интеллекта при Правительстве Российской Федерации Ильдар Ахметов. Форум прошел на полях 29-го Петербургского международного экономического форума и объединил представителей органов государственной власти, бизнеса, научного и экспертного сообщества.

02.06.2026
28 мая 2026 в Москве состоялся второй Всероссийский форум «Безопасность объектов ТЭК»

28 мая 2026 в Москве состоялся второй Всероссийский форум «Безопасность объектов ТЭК», объединивший более 200 участников из 130 организаций и предприятий топливно-энергетического комплекса, представителей федеральных органов власти, научного сообщества, отраслевых объединений, разработчиков технологий и экспертов в области промышленной, информационной и антитеррористической безопасности.

Смотрите, читайте, критикуйте