Полный гид Mac 2026 и лучшие локальные модели:
с чего начать с Ollama
Если вы знаете ChatGPT, но хотите ИИ без интернета и без утечки данных с Mac, Ollama — первый инструмент, с которым вы столкнётесь. Это не одна модель, а приложение для загрузки и запуска локальных моделей. Сложность — в паре «unified memory + размер модели»: новый Mac лучше от 24 ГБ, на годы — 32 ГБ, стабильные 70B — с 64 ГБ (проверено 2026-05-26).
Вы, скорее всего, пользовались ChatGPT в браузере. Локальный ИИ на Mac устроен иначе: веса лежат на диске, вычисления идут на вашем чипе, данные не покидают машину, если вы сами этого не решите. Цифры 8B, 14B или 70B похожи на рейтинг, но на Apple Silicon от того, сколько unified memory вы купили, зависит, будет ли модель работать каждый день — а не от надписи M4 или M5 на корпусе.
1Что такое Ollama (и чем она не является)
Удобно думать тремя слоями: инструмент, модель, железо. Ollama — инструмент: скачивает файлы моделей, поднимает локальный API и позволяет переключать теги вроде qwen2.5:7b. Нужны macOS 14+ и Metal на Apple Silicon.
Qwen, DeepSeek, Gemma и Llama — разные семейства моделей от разных команд. Ollama их не заменяет: это способ запустить их на Mac. Метка 7b — примерно семь миллиардов параметров: больше параметров обычно даёт лучшие ответы и сильнее нагружает RAM. Квантование (часто Q4) уменьшает размер файла, слегка снижая точность, чтобы модель поместилась в ту же память.
2Почему сначала смотрят на unified memory
На Apple Silicon CPU, GPU и Neural Engine делят один пул unified memory. Из него берутся веса модели, контекстное окно (история диалога в RAM), macOS и приложения вроде Xcode или браузера — высокий балл в бенчмарке не спасёт, если память забита.
Когда RAM не хватает, macOS уходит в swap на SSD. Маленькие модели могут подтормаживать; крупные — стать непригодными для работы. Загрузить 70B в Q4 на 32 ГБ для короткой демонстрации можно; назвать это основным кодовым ассистентом — другое дело. Для большинства 64 ГБ — уровень, где модели класса 70B начинают ощущаться рабочим инструментом, а не разовым экспериментом.
3Линейка Mac 2026 (модели в продаже)
Ниже — пределы конфигурации Apple на 2026-05-26. Мы не угадываем неанонсированные модели и цены.
| Mac | Потолок RAM | Локальный ИИ |
|---|---|---|
| MacBook Air / iMac (M4) | 32 ГБ | Лёгкий чат, несложный код |
| Mac mini (M4 / M4 Pro) | 32 ГБ / 64 ГБ | Лучшее соотношение цена/столвыбор |
| MacBook Pro (семейство M4) | до 128 ГБ | Мобильность + тяжёлые модели |
| Mac Studio / Mac Pro | 128–256 ГБ+ | RAG, агенты, несколько моделей |
4Лучшие модели Ollama по объёму памяти
«Загрузилась» ≠ «удобно каждый день». Таблица — для типичных Q4-квантов и обычного рабочего стола в фоне.
| RAM | Рекомендуем | Кратко попробовать | Не для ежедневной работы |
|---|---|---|---|
| 8 ГБ | llama3.2:3b | qwen2.5:7b | 14B+ |
| 16 ГБ | qwen2.5:7b | deepseek-r1:8b | 32B + тяжёлый RAG |
| 24 ГБ | qwen2.5:14b | 32B Q4 | 70B |
| 32 ГБ | 14B / 32B Q4 | короткий тест 70B | 70B как основная модель |
| 64 ГБ+ | 32B, 70B Q4 | агенты с длинным контекстом | класс 235B+ |
Выбор по задаче, а не по хайпу
- →Чат / заметки: 7B–8B (например
qwen2.5:7b,gemma2:9b) - →Код:
qwen2.5-coderилиdeepseek-coderв размере, который позволяет RAM - →Рассуждение:
deepseek-r18B–14B на машинах с 24–32 ГБ - →Зрение: мультимодальные теги вроде
llava— закладывайте запас RAM под картинки - →RAG / база локального агента: 14B–32B с запасом; длинный контекст быстро съедает память
Начните с ollama run qwen2.5:7b. Если в «Мониторинге системы» при обычной работе активен swap — сначала увеличьте RAM, потом гонитесь за большим тегом.
5Уровни покупки на 2026 год
Вход (24 ГБ): минимум для нового Mac под локальный ИИ — комфортные 7B–14B, редкие пробы 32B.
На годы (32 ГБ): оптимум для разработчиков и авторов с ежедневными 14B–32B.
Тяжёлая нагрузка (64 ГБ): когда 70B Q4 должен быть рабочей лошадкой, а не демо.
Студийный класс (128 ГБ+): несколько моделей, длинный контекст, агенты 24/7 — территория Mac Studio.
16 ГБ и меньше: можно попробовать Ollama; плохой выбор, если локальный ИИ — главная причина покупки.
6Почему Mac mini подходит для локального ИИ
Unified memory Apple Silicon и бэкенд Metal дают Ollama высокую пропускную способность на ватт. В macOS — полноценный Unix: Homebrew, Docker, SSH без борьбы с драйверами. Mac mini M4 потребляет на простое порядка нескольких ватт, работает тихо и может крутить модели круглосуточно на столе или в шкафу. Gatekeeper, SIP и FileVault снижают повседневный риск вредоносного ПО по сравнению с типичным Windows, который всегда включён.
Для многих читателей Mac mini M4 с 24 ГБ и больше — самый выгодный способ применить этот гид; можно и прогнать тот же стек на удалённом Mac, прежде чем покупать железо.
- 1Ollama = инструмент; Qwen/DeepSeek и др. = модели; RAM задаёт потолок
- 224 / 32 / 64 ГБ ≈ ежедневные 7B / 14–32B / 70B
- 3Старт с
qwen2.5:7b, масштабирование по реальной нагрузке swap