# -*- coding: utf-8 -*-
"""
Created on Sun Mar  8 19:06:54 2020

@author: Márton
"""

# Pandas betöltése
import pandas as pd;

# Adatállomány beolvasása
df = pd.read_csv(r"C:\Users\Márton\Documents\Python Scripts\Gépi Tanulás\Data\Social_Network_Ads.csv");

# Dummy (kategórikus) változók
df_getdummy=pd.get_dummies(data=df, columns=['Gender']);

# Input - output
X = df_getdummy.drop('Purchased',axis=1);
y = df_getdummy['Purchased'];

# Tanító és teszt
from sklearn.model_selection import train_test_split;
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 2020);

# Átskálázás
from sklearn.preprocessing import StandardScaler;
sc = StandardScaler();
X_train = sc.fit_transform(X_train);
X_test = sc.transform(X_test);

# Logisztikus regresszió illesztése a tanító állományra
from sklearn.linear_model import LogisticRegression;
classifier = LogisticRegression(random_state = 2020);
classifier.fit(X_train, y_train);

# predikció a tesztállományon
y_pred = classifier.predict(X_test);

# Egyetértési mátrix
from sklearn.metrics import confusion_matrix;
confusion_matrix(y_test, y_pred);

# Pontosság
from sklearn.metrics import accuracy_score;
accuracy_score(y_true=y_train, y_pred=classifier.predict(X_train));