BTC $76,782 ▼ 0.443% ETH $2,095 ▼ 0.335% BNB $658 ▲ 0.029% SOL $84 ▼ 1.279% BTC $76,782 ▼ 0.443% ETH $2,095 ▼ 0.335% BNB $658 ▲ 0.029% SOL $84 ▼ 1.279%
Bitcoin

Крипторивальня

Інноваційний шлях розвитку AI

Як завжди, розвиток інформатики відкриває нові можливості для створення самостійних інтелектуальних моделей. Тепер ми можемо працювати з даними приватно, налаштувати систему під свої завдання та контролювати середовище самостійно. Але запуск таких моделей потребує розуміння базових інструментів від репозиторіїв та вагових моделей до облачних середовищ та технічних характеристик.

У статті ForkLog розповідається про те, як почати знайомство з самостійними моделями AI без витрат. Також мова йде про ресурси, які можна використовувати новачкам та про пропозиції розробників OS-рішень.

Для розробників відкритих моделей AI існує дві основні платформи – GitHub та Hugging Face. GitHub використовується традиційно для публікації джерело-коду, документації та встановлювальних скриптів, тоді як Hugging Face став глобальним хабом для вагових моделей, датасетів та готових ML-рішень. На Hugging Face публікують сотні тисяч навчених нейронних мереж від малих мовних моделей для смартфонів до спеціалізованих алгоритмів для вчених та ентузіастів.

За допомогою метрик активності спільноти можна вибрати необхідну модель. На GitHub вони представлені кількістю зірок (stars), регулярністю оновлень (commits) та швидкістю вирішення питань (issues).

Також важливо перевірити походження продукту та справжність репозиторія. Популярні OS-сборки регулярно стають приманкою для кібер-мошенників, які розповсюджують шкідливий код під виглядом відомих ІІ-інструментів.

Мій особистий аналог ChatGPT – величезне число самостійних LLM загального призначення (аналогів ChatGPT або Gemini). Оберігає необхідну модель допомагають незалежні рейтинги на основі сліпого тестування та метрик продуктивності, такі як Open LLM Leaderboard і Chatbot Arena.

Золотим стандартом сегмента вважається сімейство моделей Llama розробника Meta і Qwen від Alibaba. Ці моделі добре працюють з довгим контекстом, виконують багато кроків за запитом та підходять для завдань ві-бкодинга і програмування. Благодаря відкритому фреймворку Ollama їх встановлення зменшує до однієї команди.

Під час випробувань, проведених для написання цієї статті, модель qwen3.5:2b змогла запустити на ноутбук без дискретної відеокарти на основі Core i7 із 8 ГБ RAM і SSD, закривши при цьому важливі програми: мессенджери та браузери.

«2b» означає 2 мільярди параметрів. Значення вище вказує на те, яким складнішим можуть бути зв’язки нейронної мережі. Наприклад, модель 2b вивчає базову граматику та прості команди, тоді як 122b запам’ятовує факти з квантової фізики, тонкощі юридичних документів та навчається планувати завдання на десять кроків вперед.

У роботі з федеративними рішеннями варто вважати юридичний аспект.许多 популярні проекти доступні під класичними ліцензіями, такими як MIT або Apache 2.0, що дозволяє використовувати їх не лише в некомерційних цілях, але й в комерційних з мінімальними обмеженнями.

Однак існує й спеціфічні підходи. Meta поширює свої флагманські моделі під власною ліцензією Llama 3.1 Community License, яка вимагає отримання спеціального дозволу, якщо щомісячна аудиторія послуги перевищує 700 млн користувачів.

Строгі ліцензії, такі як GNU General Public License, також зустрічаються, зобов’язуючи відкривати код усіх похідних продуктів.

Для розробників відкритих моделей AI існує дві основні платформи – GitHub та Hugging Face. GitHub використовується традиційно для публікації джерело-коду, документації та встановлювальних скриптів, тоді як Hugging Face став глобальним хабом для вагових моделей, датасетів та готових ML-рішень.

За допомогою метрик активності спільноти можна вибрати необхідну модель. На GitHub вони представлені кількістю зірок (stars), регулярністю оновлень (commits) та швидкістю вирішення питань (issues).

Також важливо перевірити походження продукту та справжність репозиторія. популярні OS-сборки регулярно стають приманкою для кібер-мошенників, які розповсюджують шкідливий код під виглядом відомих ІІ-інструментів.

Для користувачів без потужного обладнання існує багато вільних та умовно-вільних облачних платформ. На перший погляд, найпопулярнішою пропозицією є Google Colab — облачна середовище, яке надає доступ до графічних процесорів (GPU) прямо зі свого браузера.

Безкоштовна підписка дозволяє працювати на системі з ускоренням Nvidia Tesla T4 протягом декількох годин у залежності від навантаження. Альтернативами є Kaggle Notebooks та Hugging Face Spaces. Остання дозволяє взаємодіяти з моделями через готові інтерфейси, такі як Gradio або Streamlit.

Також варто звернути увагу на юридичний аспект роботи з федеративними рішеннями. Многі популярні проекти доступні під класичними ліцензіями, такими як MIT або Apache 2.0, що дозволяє використовувати їх не лише в некомерційних цілях, але й в комерційних з мінімальними обмеженнями.

Однак існує й спеціфічні підходи. Meta поширює свої флагманські моделі під власною ліцензією Llama 3.1 Community License, яка вимагає отримання спеціального дозволу, якщо щомісячна аудиторія послуги перевищує 700 млн користувачів.

Строгі ліцензії, такі як GNU General Public License, також зустрічаються, зобов’язуючи відкривати код усіх похідних продуктів.

Для розробників відкритих моделей AI існує дві основні платформи – GitHub та Hugging Face. GitHub використовується традиційно для публікації джерело-коду, документації та встановлювальних скриптів, тоді як Hugging Face став глобальним хабом для вагових моделей, датасетів та готових ML-рішень.

За допомогою метрик активності спільноти можна вибрати необхідну модель. На GitHub вони представлені кількістю зірок (stars), регулярністю оновлень (commits) та швидкістю вирішення питань (issues).

Також важливо перевірити походження продукту та справжність репозиторія. популярні OS-сборки регулярно стають приманкою для кібер-мошенників, які розповсюджують шкідливий код під виглядом відомих ІІ-інструментів.

Для користувачів без потужного обладнання існує багато вільних та умовно-вільних облачних платформ. На перший погляд, найпопулярнішою пропозицією є Google Colab — облачна середовище, яке надає доступ до графічних процесорів (GPU) прямо зі свого браузера.

Безкоштовна підписка дозволяє працювати на системі з ускоренням Nvidia Tesla T4 протягом декількох годин у залежності від навантаження. Альтернативами є Kaggle Notebooks та Hugging Face Spaces. Остання дозволяє взаємодіяти з моделями через готові інтерфейси, такі як Gradio або Streamlit.

Також варто звернути увагу на юридичний аспект роботи з федеративними рішеннями. Многі популярні проекти доступні під класичними ліцензіями, такими як MIT або Apache 2.0


За матеріалами ForkLog

Європа запускає стейблкоїн у 37 банках “Інструмент розвідки”