Декабрь — то самое время, когда мы вспоминаем важные события, яркие моменты, и оцениваем достижения этого года. В этот период на Хабре мы стараемся взглянуть на все события с более широкой перспективы.
Судя по вашим оценкам, в уходящем году наибольшему вниманию удостоились статьи редакции про ИИ, подборки образовательных материалов (особенно — книги), а также глубокие авторские работы практикующих экспертов.
Самое главное от CloudMTS — далее под катом.
ИИ
Объясняем простым языком, что такое трансформеры
Трансформерная архитектура произвела революцию в машинном обучении и открыла новые горизонты для автоматического понимания и генерации текста. На ее основе были созданы большие языковые модели вроде ChatGPT, GPT-4 и LLama. В статье объясняем без кода и сложной математики.
Почему большие языковые модели [пока] глупее, чем кажутся
C расширением спектра возможностей и применений интеллектуальных систем увеличивается и простор для некорректного использования результатов их работы. Становится сложнее понять, когда нейросеть генерирует не совсем точный ответ, и оценить риски для рабочих задач. В статье говорим о том, насколько серьезна проблема с LLM (large language models) и что с ней можно сделать.
Бонус
Компании, которые работают с ИИ, могут обучать нейросети на графических ускорителях в виртуальной инфраструктуре CloudMTS.
ОБРАЗОВАНИЕ
Больше книг о СУБД — для тех, кто хочет погрузиться в работу с PostgreSQL
Мы собрали свежие издания разного уровня — от знакомства с PostgreSQL до продвинутых техник обработки данных. Все материалы в подборке получили высокие оценки и рекомендации от резидентов Hacker News и Reddit.
Как узнать больше об Apache Kafka: от базовых настроек до архитектуры сервисов
Apache Kafka — распределенный программный брокер сообщений с открытым исходным кодом. Его ключевая задача — собирать данные у приложений и хранить их в распределенном хранилище. Собрали подборку книг, которые помогут разобраться в его работе. Подробная рецензия на каждую — в нашей статье.
17 вопросов по Kubernetes, которые может услышать разработчик на собеседовании
Kubernetes уже стал мейнстримовой технологией. Понимание азов даст разработчику лучшее представление о том, как приложение живет и работает в Kubernetes. В статье мы собрали список вопросов про Kubernetes, с которыми может столкнуться разработчик на собеседовании, подготовили короткие ответы и ссылки на более подробную информацию в документации.
МАТЕРИАЛЫ ОБЛАЧНЫХ ЭКСПЕРТОВ
Управляем пользователями и топиками Apache Kafka с помощью оператора Kubernetes
Иван Гулаков – техлид DevOps-команды, отвечающей за инфраструктуру, где работают облачные сервисы CloudMTS. Иван рассказал, как с помощью самописного оператора Kubernetes мы автоматизировали управление пользователями и топиками наших Kafka-кластеров.
Несколько мыслей по подготовке к алгоритмической части собеседования
Петр Коробейников поделился опытом подготовки к прохождению алгоритмических интервью. Статья не про хардкорные алгоритмы, а, скорее, эскиз к роадмапу по подготовке. Тем не менее, материал будет полезен новичкам.
В поисках идеальной Headless CMS для масштабных проектов: как выбрать лучшее решение
Множество команд сталкиваются с решением вопроса по управлению контентом на различных платформах — от веб-сайтов до мобильных приложений и интернет-магазинов. Наша команда Enablement Platform провела пилот по сравнению нескольких популярных в 2023 году решений для CMS. Накопленный материал будет полезен веб-разработчикам.
Как полностью устранить дублирующие записи в ClickHouse
Мы используем ClickHouse в сервисе отчетов и предоставления клиентской детализации потребления ресурсов и их стоимости. Дублирующие записи ведут к искажению стоимости потребляемых услуг: если появится дубль, в личном кабинете сумма станет больше, чем пользователь потратил на самом деле. Валерий Локтаев, backend-разработчик сервиса биллинга в CloudMTS рассказал, как избежать такой ситуации.
Бонус: запоминающиеся кейсы обеспечения полной надежности в облаке
Сеть магазинов MODIS перенесла в облако ИТ-инфраструктуру
MODIS — крупный федеральный поставщик одежды. После ухода разработчика ПО из России MODIS потребовалось перенести важную часть ИТ-инфраструктуры в российское облако. Мы разработали этапы миграции, создали полную резервную копию SAP-системы, перенесли ее на площадку заказчика, а затем восстановили базу данных в дата-центре CloudMTS
Компания Unilever развернула в облаке более 100 ТБ данных
Unilever — международный производитель более 400 брендов бытовой химии и продуктов питания. Компания перенесла в геораспределенное российское облако корпоративные системы, включая хранилище данных (Data Warehouse) и систему управления бизнес-процессами на базе SAP. В рамках проекта удалось локализовать ключевые бизнес-процессы: финансовое планирование, данные о продажах, управление персоналом, анализ производственных показателей и логистику.
Группа компаний ITMS перенесла в облако CloudMTS все ИТ-системы
ГК ITMS (ранее — British American Tobacco в России) полностью локализовала в российских дата-центрах все свои ИТ-системы, включая Microsoft Exchange, VDI и системы управления предприятием. CloudMTS также взял на себя поддержку доменов, почтовых сервисов и ПО для совместной работы сотрудников компании. В ходе миграции было перенесено более 400 терабайт данных.