Skip to content

machine learning using RandomForestRegressor and dataset with coffee data

Notifications You must be signed in to change notification settings

tsar123/Coffee-Quality-Analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

Coffee-Quality-Analysis

О наборе данных

Институт качества кофе (CQI) - некоммерческая организация, которая работает над повышением качества и ценности кофе во всем мире. Он был основан в 1996 году и имеет штаб-квартиру в Калифорнии, США. Миссия CQI заключается в продвижении качества кофе посредством ряда мероприятий, которые включают исследования, обучение и программы сертификации. Организация работает с производителями кофе, переработчиками, обжарщиками и другими заинтересованными сторонами над улучшением стандартов качества кофе, продвижением устойчивого развития и поддержкой развития индустрии специализированного кофе. CQI поддерживает веб-базу данных, которая служит ресурсом для кофейных профессионалов и энтузиастов, которым интересно узнать о качестве кофе и его экологичности. База данных включает в себя широкий спектр информации о производстве, обработке и сенсорной оценке кофе. В нем также содержатся данные о генетике кофе, типах почв и других факторах, которые могут повлиять на качество кофе. Данные были взяты с kaggle: link

image

Сенсорные оценки качества кофе

  • Аромат (Aroma): Относится к аромату кофе.
  • Вкус (Flavor): Вкус кофе оценивается на основе вкуса, включая любую сладость, горечь, кислинку и другие вкусовые нотки.
  • Послевкусие (Aftertaste): Относится к стойкому вкусу, который остается во рту после проглатывания кофе.
  • Кислотность (Acidity): Кислотность в кофе относится к яркости или живости вкуса.
  • Консистенция (Body): Консистенция кофе относится к густоте или вязкости кофе во рту.
  • Сбалансированность (Balance): Сбалансированность означает, насколько хорошо сочетаются различные вкусовые компоненты кофе.

Предварительный анализ данных

Результаты: image

image

image

image

image

image

Корреляционный анализ

Столбчатая диаграмма корреляций: image

Тепловая карта корреляции: image

Метрики обучения модели

Интерпретация результатов:

1/ Mean Absolute Error (MAE): 0.2169

Этот показатель показывает среднюю абсолютную ошибку между предсказанными и реальными значениями. Значение MAE около 0.22 может указывать на то, что в среднем предсказания отклоняются от реальных значений на 0.22 единицы. Это довольно низкое значение, что говорит о том, что модель делает точные предсказания.

2/ Mean Squared Error (MSE): 0.1078

MSE измеряет среднюю квадратичную ошибку между предсказаниями и реальными значениями. Поскольку MSE учитывает квадраты ошибок, он более чувствителен к большим ошибкам. Значение 0.1078 также указывает на хорошее качество модели.

3/ R² Score: 0.9537

Коэффициент детерминации показывает долю вариации зависимой переменной, объясняемую моделью. Значение R² близкое к 1 говорит о том, что модель объясняет около 95.37% вариации в данных. Это очень высокий показатель, который свидетельствует о том, что модель хорошо подходит обучения этих данных.

Остаточный анализ

Результаты: image

Ошибки прогнозирования регрессионной модели

Результаты: image

About

machine learning using RandomForestRegressor and dataset with coffee data

Topics

Resources

Stars

Watchers

Forks