ДОСЛІДЖЕННЯ / КОНСАЛТИНГ / РОЗВИТОК

RESEARCH CONSULTING & DEVELOPMENT


РЕЄСТРАЦІЯ НА ТРЕНІНГ Напишіть нам

ПРОГРАМИ НАВЧАННЯ






about img

Видобуванням даних (або англійською мовою Data Mining) називають процес виявлення прихованих закономірностей у великих масивах даних, які можуть походити з декількох джерел. У сучасному світі соціальних мереж та інтернету кожен користувач генерує величезні обсяги різних типів даних (постів, фотографій, твітів, покупок тощо). Ці дані потім можна автоматично аналізувати для пропозиції спеціальних тарифів, знижок або нових продуктів, які можуть зацікавити покупця. Наприклад, автомобіліст, зареєстрований у спільноті власників певної марки, може отримувати електронною поштою знижку на автомобільні товари від популярного онлайн магазину. Демографічні характеристики покупця страхового полісу напевне впливають на ймовірність настання страхового випадку. Видобування даних включає як традиційні методи математичної статистики, такі як лінійна та логістична регресія, так і більш сучасні методи: нейронні мережі, дерева рішень, моделі Байеса тощо.

Машинне навчання (або Machine Learning англійською мовою) зосереджено на розробці алгоритмів, що можуть навчатися на даних для подальшого прогнозу. Машинне навчання можна також визначити, як застосування статистичних методів у комп'ютерних алгоритмах для аналізу даних з метою прийняття оптимальних рішень. Наприклад, банк може вивчати, як демографічні дані пов'язані з невиплатою кредиту для того, щоб в майбутньому класифікувати нових клієнтів як «надійних» (кредит надається) та «проблемних» (кредит не надається). Мережа супермаркетів може розробляти систему прогнозу продажів для оптимізації складських запасів з урахуванням сезонних коливань попиту. Машинне навчання тісно пов'язане із комп'ютерною статистикою, яка розробляє алгоритми для впровадження статистичних методів на комп'ютерах. Залежно від типу системи машинного навчання розрізняють клаcифікацію, регресію, кластеризацію та ін.

Мова програмування R є легально-безкоштовним програмним середовищем для побудови статистичних моделей, аналізу та видобування даних, графічного представлення результатів та візуалізації даних. Одною із основних переваг мови R є велика кількість спеціалізованих пакетів, створених користувачами. Ці додаткові функції спроможні виконувати вузько-спеціалізовані задачі та доступні для скачування на сайті Comprehensive R Archive Network (CRAN). Графічні інтерфейси користувача, наприклад RStudio, дозволяють навіть початківцям швидко опанувати базовими навичками роботи.

Мова R є однією з найпопулярніших для machine learning та data mining, як можна переконатися на спеціалізованих платформах і форумах типу Kaggle. R також популярна серед науковців, в основному статистиків, але в тому числі і економістів, соціологів та політологів. Існує також широкий вибір методичок та підручників з покроковими інструкціями, програмами та прикладами.

КОНТАКТИ


Logo RC&D

КОНТАКТНА ІНФОРМАЦІЯ

Якщо вас зацікавила співпраця з нашою компанією, будь ласка, скористайтеся контактною інформацією.

EMAIL

brilliantstartups@gmail.com

ТЕЛЕФОН

+38 (044) 583 0115