Аналіз характеристик фільмів та їх успішності за допомогою Dataset Movies у мові R
Анотація
Аналіз даних є важливим інструментом для виявлення закономірностей у великих масивах інформації. У цій роботі досліджується набір даних про фільми (movies) з пакету ggplot2movies [1] у середовищі R, який містить інформацію про жанри, рік випуску, тривалість, рейтинг та інші характеристики понад 58 тисяч фільмів. Метою дослідження є вивчення структури даних за допомогою кластерного аналізу та побудова моделей класифікації для прогнозування успішності фільмів. Робота базується на методах ієрархічної кластеризації, K-середніх та логістичної регресії, а також демонструє можливості мови R для статистичного аналізу та візуалізації.
Посилання
Datasets. URL: https://www.kaggle.com/datasets
Освоюємо мову R. Вікіпідручник. 04.12.2025. URL: https://uk.wikibooks.org/wiki/%D0 %9E%D1%81%D0%B2%D0%BE%D1%8E%D1%94%D0%BC%D0%BE_R
Кофанов О. Є., Солнцев С. О., Зозульов О. В. Програмування із використанням R у статистичних та маркетингових дослідженнях: навчально-методичний комплекс дисципліни: навч. посіб. для студентів спеціальності 075 «Маркетинг» / КПІ ім. Ігоря Сікорського. Київ: КПІ ім. Ігоря Сікорського, 2023. 204 с. URL: https://ela.kpi.ua/server/api/core/bitstreams/ f78aa74c-7d8d-4c84-87eb-18a4aec57476/content
Data Science, лекція – Мова програмування R. YouTube. 03.05.2022. URL: https://www.youtube.com/watch?v=DiKwo_hgFfM