Анализ лиц с домофона: как я победил несовместимости и собрал dlib+CUDA на Ubuntu — готовый скрипт

Каждый день мимо двери моего подъезда проходят десятки людей. Соседей я знаю в лицо, но кто все остальные? Курьеры, случайные гости, а может, кто-то что-то высматривает?

Домофонная камера всё записывает, но вручную пересматривать часы видео бессмысленно. Мне захотелось сделать систему, которая сама будет находить и запоминать лица, чтобы потом показать, кто у двери появляется чаще всего.

Это желание про безопасность — узнать «постоянных незнакомцев» и про личное увлечение: я люблю разбираться в технологиях, а это отличный повод попробовать компьютерное зрение и ускорение работы на видеокарте.

На словах всё выглядело просто, а на деле пришлось пройти целый квест из несовместимых программ, капризных драйверов и упрямой библиотеки распознавания лиц. Но в итоге я собрал рабочий инструмент, и теперь расскажу, как это было.

Проект выложен на GitHub.

Читать

Теперь ChatGPT-5 будет придумывать запросы за вас

Похоже, OpenAI решила, что пользователи всё равно думают слишком много — и выкатили инструмент, который будет думать за вас. Речь о генераторе промптов, который сам составит запрос для ChatGPT так, чтобы модель не впала в галлюцинации и не ответила ерунду.

Теперь больше не нужно читать туториалы «как писать правильные промпты для чайников» — генератор сам превратит его в аккуратный, структурированный промпт, который модель «проглотит» без ошибок и галлюцинаций.

Читать

WHOFI новое любимое слово любителей теорий заговора

Хочу обратить внимание всей прогрессивной (а вы же именно такие) общественности на уже не новую, но очень интересную технологию.

https://arxiv.org/html/2507.12869v1 в этой статье рассматривается практика идентификакции людей через wifi используя для этого стандарт IEEE 802.11bf от 2020 года. Данный стандарт позволяет получать уникальную картину искажения Wi‑Fi сигнала телом человека и повторно идентифицировать его. При этом не обязательно иметь при себе какие-либо устройства. Осталось только промаркировать нас.

WhoFi — технология идентификации людей по воздействию тела на сигнал Wi-Fi. Это уже работает

Разработали эту «волшебную» систему хитроумные итальянские учёные из Римского университета Ла Сапиенца.

Читать

Своя ОС?

Дарова! Сегодня я поделюсь с вами опытом, как я пытался написать собственную ОС и, что из этого вышло. Запасайтесь чайком с печеньками и присаживайтесь поудобнее! Пора окунуться в 16ти битный мир…


С чего начать?

Я начал с изучения ЯП ассемблера. Далее нам понадобится hex редактор (да, я его тоже использовал) и редактор образов дисков. И последнее, что понадобится виртуальная машина. Конкретных рекомендаций давать не буду, но я использовал:

  • HxD hex-редактор
  • ЯП — fasm
  • ultraISO в качестве программы для создания и редактирования образов дисков
  • VMBox — виртуальная машина, хотя во многих туториалах и гайдах использовали qemu (я просто с ним не разобрался)
Читать

Как запустить нейросеть у себя на компьютере: 4 простых инструмента

Вы когда‑нибудь задумывались, как это — иметь мощь языковой модели прямо на вашем компьютере? Экспериментировать с LLM (большими языковыми моделями) локально — словно открыть тайную дверь в мир ИИ… Вам открыт широкий горизонт для исследований, творчества и практического применения.

Но как запустить нейросеть на компьютере, если вы не Google? Хорошая новость: в 2025 году это стало проще и доступнее, чем когда‑либо! Вам не нужен суперкомпьютер (хотя мощная видеокарта значительно ускорит процесс). Современные эффективные модели и специализированное ПО делают локальный запуск нейросети реальностью для многих пользователей.

Давайте разберёмся, что для этого нужно. Мы рассмотрим 7 наиболее оптимальных для локального запуска моделей — Llama, Qwen, DeepSeek, Phi, Gemma, Mistral, Granite, — а также 4 быстрые и удобные программы: Ollama, LM Studio, Jan и GPT4All.

Читать

Почему Python стал языком нейросетей и как это работает на практике

Python давно перестал быть просто «языком скриптов» и уверенно вышел в лидеры среди инструментов для нейросетей. Его синтаксис понятен «с первого взгляда», а мощные библиотеки позволяют сосредоточиться на идее, а не на рутине. Сегодня, от первых численных расчётов в NumPy до сложных моделей в TensorFlow и PyTorch, всё строится вокруг привычного Python-кода. 

В этой статье мы пройдём путь от базовых скриптов до «ручных» нейросетей и ноукод-решений, чтобы понять, почему именно Python стал стандартом в мире ИИ и как с его помощью оживить ваши первые нейросети.

Читать

Матричные фильтры обработки изображений

Данная статья рассказывает не только о наиболее распространённых фильтрах обработки изображений, но в понятной форме описывает алгоритмы их работы. Статья ориентирована, прежде всего, на программистов, занимающихся обработкой изображений.

Матрица свёртки

Фильтров использующих матрицу свёртки много, ниже будут описаны основные из них.

Матрица свёртки – это матрица коэффициентов, которая «умножается» на значение пикселей изображения для получения требуемого результата.
Ниже представлено применение матрицы свёртки:

Применение матрицы свёртки

div – это коэффициент нормирования, для того чтобы средняя интенсивность оставалась не изменой.

В примере матрица имеет размер 3×3, хотя размер может быть и больше.

Читать

Введение в архитектуры нейронных сетей

Григорий Сапунов (Intento)

Меня зовут Григорий Сапунов, я СТО компании Intento. Занимаюсь я нейросетями довольно давно и machine learning’ом, в частности, занимался построением нейросетевых распознавателей дорожных знаков и номеров. Участвую в проекте по нейросетевой стилизации изображений, помогаю многим компаниям.

Давайте перейдем сразу к делу. Моя цель — дать вам базовую терминологию и понимание, что к чему в этой области, из каких кирпичиков собираются нейросети, и как это использовать.

План доклада такой. Сначала небольшое введение про то, что такое нейроннейросетьглубокая нейросеть, чтобы мы с вами общались на одном языке.

Дальше я расскажу про важные тренды, что происходит в этой области. Затем мы углубимся в архитектуру нейросетей, рассмотрим 3 основных их класса. Это будет самая содержательная часть.

После этого рассмотрим 2 сравнительно продвинутых темы и закончим небольшим обзором фреймворков и библиотек для работы с нейросетями.

На конференции Наталья Ефремова из компании NTechLab рассказывала о практических кейсах. Я же расскажу, как нейросети устроены внутри, из каких кирпичиков они внутри состоят.

Читать

Как дообучить LLaMA бесплатно и без программирования: как создать тупого друга

Прошло уже около полугода как Meta* случайно слили свою языковую модель LLaMA. А недавно они сами выложили в открытый доступ ее 2-ую версию. Для понимания масштаба — на обучение Meta* потратили более 3 311 616 GPU часов. Это примерно 378 лет работы одной мощной видеокарты. В этой статье я расскажу как я смог бесплатно и без мощного железа дообучить LLaMA на диалогах с друзьями в ВК, чтобы сделать чат бота, который копирует наш стиль общения, оживляет разговор в чате и просто пишет странные и смешные вещи. В статье будет мало терминов, тут я простым языком расскажу как вы можете обучить большую языковую модель.

"Лама пытается написать умный текст про своё обучение"
«Лама пытается написать умный текст про своё обучение»
Читать