# 텐서플로를 사용한 다중 선형 회귀 복습 문제


---


## 문제 설명

다음과 같은 가상의 주택 가격 데이터셋을 사용하여 다중 선형 회귀 모델을 학습하고, 성능을 평가하며, 특정 조건의 주택 가격을 예측하는 문제입니다.

| 방 개수 (RM) | 학생/교사 비율 (PTRATIO) | 주택 가격 (MEDV) |
|---|---|---|
| 5 | 20 | 20 |
| 6 | 18 | 30 |
| 7 | 16 | 40 |
| 8 | 14 | 50 |
| 9 | 12 | 60 |
| 5 | 15 | 25 |
| 6 | 13 | 35 |
| 7 | 11 | 45 |
| 8 | 9 | 55 |
| 9 | 7 | 65 |
|6| 19| 28|
|7| 17| 38|
|8| 15| 48|
|9| 13| 58|
|5| 14| 23|
|6| 12| 33|
|7| 10| 43|
|8| 8| 53|
|9| 6| 63|

1.  Numpy 배열을 가지고 X와 y를 설정하세요.
2.  텐서플로우를 사용하여 다중 선형 회귀 모델을 학습하세요.
3.  학습된 모델의 성능을 평가하고, 방의 개수가 7개이고 학생/교사 비율이 15인 주택의 가격을 예측하세요.


---


## 힌트


*   "모두의 딥러닝" 참고
*  model을 compile 하기 전 학습률을 조정해야지 결과가 나옵니다. 아래 코드를 추가해 주세요


In [21]:
optimizer = tf.keras.optimizers.SGD(learning_rate=0.001)

In [22]:
# 호출 라이브러리
import numpy as np
import tensorflow as tf

# 텐서플로의 케라스 API에서 필요한 함수들을 불러옴
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Input

#옵티마이저 및 과적합 방지 조기종료(EarlyStopping) 라이브러리추가
from tensorflow.keras.optimizers import SGD
from tensorflow.keras.callbacks import EarlyStopping

In [23]:
# 전체 데이터셋
data = np.array([[5, 20, 20],[6, 18, 30],[7, 16, 40],[8, 14, 50],[9, 12, 60],
    [5, 15, 25],[6, 13, 35],[7, 11, 45],[8, 9, 55],[9, 7, 65],[6, 19, 28],[7, 17, 38],
     [8, 15, 48],[9, 13, 58],[5, 14, 23],[6, 12, 33],[7, 10, 43],[8, 8, 53],[9, 6, 63]
])

In [26]:
# 정답 입력

# 입력 데이터 (X: 방 개수(RM), 학생/교사 비율(PTRATIO))
X = data[:, :-1]
# 정답 데이터 (y: 주택 가격(MEDV))
y = data[:, -1]

# 모델 생성
# Sequential 모델을 생성하여 다중 선형 회귀 모델을 구성
model = Sequential([
    Input(shape=(2,)),  # 입력층 : 2개의 특징(방 개수, 학생/교사 비율)
    Dense(1, activation='linear')  # 출력층 : 선형 회귀 모델
])

# 옵티마이저 설정
# 확률적 경사 하강법(SGD) 옵티마이저 사용, 학습률은 0.001로 설정
optimizer = tf.keras.optimizers.SGD(learning_rate=0.001)

# 모델 컴파일
# 평균 제곱 오차(MSE, Mean Squared Error)를 손실 함수로 사용, 옵티마이저는 위에서 설정한 SGD 적용
model.compile(optimizer=optimizer, loss='mse')

# Early Stopping 추가
# 학습 과정에서 손실 값이 더 이상 개선되지 않으면 조기 종료
# 'loss' 모니터링, 20 epoch 동안 개선되지 않으면 종료
# restore_best_weights=True 설정으로 최적의 가중치를 복원
early_stopping = EarlyStopping(monitor='loss', patience=20, restore_best_weights=True)

# 모델 학습
# 에포크 1000번(조기종료 설정 있음), verbose=0 >>> 로그출력 없이 학습
model.fit(X, y, epochs=1000, verbose=0, callbacks=[early_stopping])

# 모델 평가, verbose=0 >>> 로그출력 없이 학습
loss = model.evaluate(X, y, verbose=0)

# 모델의 최종 손실 값 출력
print(f"모델의 손실 값(MSE, Mean Squared Error): {loss:.4f}")

# 입력값: 방 개수 7개, 학생/교사 비율 15
predicted_price = model.predict(np.array([[7, 15]]))

# 예측된 주택 가격 출력
print(f"방 개수 7개, 학생/교사 비율 15일 때 예측 주택 가격: {predicted_price[0,0]:.2f}")



모델의 손실 값(MSE, Mean Squared Error): 1.6384
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 88ms/step
방 개수 7개, 학생/교사 비율 15일 때 예측 주택 가격: 40.12
