Видове изкуствен интелект — практична карта с български фокус
Точната класификация спестява време и грешки: избираш типа модел според задачата, а не според модата. По-долу има кратка карта на основните видове AI/ИИ и какво вече работи на български за всеки от тях.
Класическите класификации накратко (ANI/AGI/ASI)
-
ANI (тесен ИИ): днешните реални системи за конкретни задачи.
-
AGI: хипотетичен „общ“ интелект с човешка гъвкавост — няма практическа реализация.
-
ASI: спекулативно ниво отвъд човешките способности.
Защо тук класифицираме по приложение: това помага да изберете правилния инструмент на български още днес (LLM, изображения, реч, OCR, CV, RAG, агенти).
Езикови модели (LLM)
Модели за разбиране и генериране на текст: писане, редакция, резюмиране, извличане на факти, стилова адаптация. На български дават естествени формулировки, по-добро съгласуване (род/число, пълен член) и коректни кавички „…“. Ако избирате конкретен модел за български текст, вижте и Матрица на моделите за български.
Практично: при текстове с много англоезични термини или код работи стратегията EN генерация → BG стилова адаптация
Генеративни изображения (дифузионни модели)
Създават и редактират изображения по текстово описание. Полезни за визуални концепции, корици, банери и илюстрации; кирилица в изображение е възможна, но качеството варира — проверявайте правописа и четимостта. Подхождат за идеи и първи варианти, а финалната типография правете с графичен редактор.
Практично: за текст върху изображение предпочитайте векторен overlay, не директно „нарисуван“ текст от модела.
Реч: разпознаване (ASR) и синтез (TTS)
ASR превръща българска реч в текст (диктовка, субтитри, стенограми), TTS чете текст на глас (озвучаване, достъпност). Добре се справят с общобългарско произношение, но проверявайте собствени имена и топоними; при силен диалект — кратка постредакция.
Практично: дефинирайте кратък речник (pronunciation/термини) за проекта и го поддържайте.
Машинен превод (NMT)
Автоматичен превод между езици. Подходящ за ориентация, резюме или чернова; за публикуване на български е желателна редакторска адаптация (стил, колокации, пунктуация). Правни/технически текстове изискват двуезична проверка.
Практично: поддържайте терминологичен глосар (termbase) и го налагайте при постредакция.
Документна обработка: OCR и структуриране
OCR разпознава кирилица от сканирани документи/снимки; комбинирано с LLM извлича полета (дати, суми, адреси) и прилага фирмени норми. При по-сложни шаблони (фактури, договори) настройте правила и валидации за висока точност.
Практично: планирайте fallback — ако полето липсва/не е сигурно, върнете „неуверено“ вместо измислена стойност.
Компютърно зрение (CV)
Детекция/класификация на обекти, сегментация, търсене по изображение. Удобно за контрол на качество, етикетиране, модерация. Българският контекст се проявява в етикетите/термините — поддържайте консистентен речник и тестови набори с локални сцени.
Практично: измервайте на отделен български валидационен набор; не разчитайте само на общи международни датасети.
RAG (търсене + генериране)
Комбинира търсене във вашия корпус (български документи, уебсайт, база знания) с отговори от LLM. Така се получават по-фактологични резултати и по-малко „измисляне“. Критично: качествено индексиране на български текст, актуални източници и ясни инструкции към модела.
Практично: настройте fail-closed поведение — ако няма релевантни пасажи, отговор „не е намерено“ с предложени следващи стъпки (по-добре да признае, че няма данни, отколкото да измисля).
Агенти и инструменти
Оркестрират стъпки и използват външни инструменти (таблици, търсене, калкулатори, API). Подходящи за процеси: „вземи данни → провери → обобщи → напиши чернова на български“. Ясните правила и примерни изходи (expected outputs) намаляват грешките.
Практично: сложете „guardrails“ (валидатори и стоп-условия) за числови полета, лични данни и дати.
Кой тип е правилният за моята задача?
-
Неструктуриран текст (писане/редакция/резюме) → LLM (чернова + финален стил).
-
PDF, сканове, формуляри → OCR → извличане → LLM (структуриране на полета).
-
Аудио/видео → ASR за текст, TTS за глас (достъпност/озвучаване).
-
Собствена база знания → RAG върху български корпус (по-фактологични отговори).
-
Визуални концепции/корекции → генеративни изображения (типографията — ръчно).
-
Многостъпкови процеси → агенти с инструменти (валидатори/стоп-условия).
Какво е специфично за български
-
Морфология и пълен член влияят на четимостта — LLM помага, но финалната проверка е ключова.
-
Кавички „…“, тирета (—), интервали и съкращения — следвайте фирмения стандарт (Style Dictionary).
-
Локални формати (дати, суми, адреси) — валидирайте автоматично.
-
Собствени имена и транскрипции — поддържайте речник на проекта.
-
Нишови англоезични термини/код: често е по-добре EN генерация → BG стилова адаптация.


