{ "cells": [ { "cell_type": "markdown", "id": "9d2b1489-2c3c-4097-9733-78c5cfdd72ab", "metadata": {}, "source": [ "### 과대적합과 과소적합\n", "\n", "\n", "#### 과대적합(overfitting)\n", "* 훈련데이터에만 잘 맞고 테스트데이터에는 낮은 정답률이 나오는 경우\n", "\n", "\n", "\n", "#### 과소적합(underfitting)\n", "* 훈련이 제대로 이루어지지 않아 테스트 데이터보다 훈련데이터의 정답률이 낮은 경우\n", "* 훈련, 테스트데이터 모두 정답률이 낮은 경우\n", "* 훈련데이터의 개수가 적을 경우\n", "\n", "\n", "\n", "---ht=\"\" />\r\n", "\r\n", "---" ] }, { "cell_type": "markdown", "id": "c24afdc0-02ee-4e95-accf-7899477c5155", "metadata": {}, "source": [ "### 스케일링\n", "* 수치형 데이터들의 값의 범위가 클 경우 사용한다.(연산 속도 증가)\n", " - 예를 들어 주식의 가격을 생각했을 경우 100원의 1%와 100000원의 1%를 계산하고자 한다면 같은 1%연산이지만 숫자가 클 경우 연산속도에 영향을 미치게 된다.\n", "* 서로 다른 변수의 값 범위를 일정한 수준으로 맞추고자 하는 경우\n", "* 대표적 스케일링 클래스는 StandardScaler, MinMaxScaler이 있다\n", "* 사용 이유\n", " - 연산속도를 올릴 수 있다\n", " - 확률을 높일 수 있다\n", " - 과대, 과소적합을 조금은 해결할 수 있다\n", "* 참고\n", " - 이상치가 있을 경우 범위의 차이가 커지게 되므로 이상치는 제거해야 한다\n", " - RandomForest는 따로 스케일링 할 필요가 없다.(tree계열은 따로 스케일 할 필요가 없다)" ] }, { "cell_type": "markdown", "id": "087379fa-55cd-422e-8c73-a45646316f3f", "metadata": {}, "source": [ "#### StandardScaler(label값은 스케일 하지 않는다)\n", "* 사이킷런에서 서포트벡터머신, 선형회귀, 로지스틱 회귀에 적용하는 것이 예측 성능 향상에 중요한 요소가 된다.\n", "* 각 특성의 평균을 0, 편차를 1로 변경하여 정규분포로 만드는 것이다\n", " - 편차(deviation)는 예측값과 평균의 차이\n", " \n", "\n", "\n", "#### MinMaxScaler(label값은 스케일 하지 않는다)\n", "* 모든 특성이 정확하게 0과 1사이에 위치하도록 데이터를 변경\n", "* k-means, k-nearest neighbor등의 알고리즘에 좋은 성능을 보인다은 성능을 보인다" ] }, { "cell_type": "code", "execution_count": 3, "id": "5445eb41-4eb0-4c7c-841c-59ba4ba15c04", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
daumnaver
021
142
263
384
4105
\n", "
" ], "text/plain": [ " daum naver\n", "0 2 1\n", "1 4 2\n", "2 6 3\n", "3 8 4\n", "4 10 5" ] }, "execution_count": 3, "metadata": {}, "output_type": "execute_result" } ], "source": [ "import pandas as pd\n", "from sklearn.preprocessing import StandardScaler\n", "\n", "# 가상의 영화 평점 데이터\n", "movie = {'daum':[2,4,6,8,10], 'naver':[1,2,3,4,5]}\n", "mv = pd.DataFrame(movie)\n", "mv" ] }, { "cell_type": "code", "execution_count": 13, "id": "57574836-5b5e-433e-8dd2-fc858a6b6c01", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
daumnaver
0-1.414214e+00-1.414214e+00
1-7.071068e-01-7.071068e-01
24.440892e-174.440892e-17
37.071068e-017.071068e-01
41.414214e+001.414214e+00
\n", "
" ], "text/plain": [ " daum naver\n", "0 -1.414214e+00 -1.414214e+00\n", "1 -7.071068e-01 -7.071068e-01\n", "2 4.440892e-17 4.440892e-17\n", "3 7.071068e-01 7.071068e-01\n", "4 1.414214e+00 1.414214e+00" ] }, "execution_count": 13, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# standardscaler 를 사용해서\n", "# 두 데이터 간의 범위를 줄인다\n", "st = StandardScaler()\n", "scaled = st.fit_transform(mv)\n", "mv = pd.DataFrame(data = scaled, columns=['daum', 'naver'])\n", "mv" ] }, { "cell_type": "code", "execution_count": 12, "id": "7e844027-5c1b-451e-8c7e-fc2aaeea9a94", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "1.0" ] }, "execution_count": 12, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# round() : 소숫점 범위를 잘라준다\n", "round(scaled.std(), 2)" ] }, { "cell_type": "code", "execution_count": null, "id": "7198e77d-c788-443c-860c-3e928ef91b48", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": null, "id": "547f6b5c-4179-40f9-ba0a-de1612dd1df5", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": 16, "id": "95d3adff-a0f4-4526-9b36-ac5d0bd9d67a", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
daumnaver
021
142
263
384
4105
\n", "
" ], "text/plain": [ " daum naver\n", "0 2 1\n", "1 4 2\n", "2 6 3\n", "3 8 4\n", "4 10 5" ] }, "execution_count": 16, "metadata": {}, "output_type": "execute_result" } ], "source": [ "from sklearn.preprocessing import MinMaxScaler\n", "mv = pd.DataFrame(movie)\n", "mv" ] }, { "cell_type": "code", "execution_count": 18, "id": "964a8dee-0318-4c5a-8c65-f93a772fd7cc", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
db
00.000.00
10.250.25
20.500.50
30.750.75
41.001.00
\n", "
" ], "text/plain": [ " d b\n", "0 0.00 0.00\n", "1 0.25 0.25\n", "2 0.50 0.50\n", "3 0.75 0.75\n", "4 1.00 1.00" ] }, "execution_count": 18, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# MinMaxScaler 를 사용해\n", "# 다른 두 값을 0 ~ 1 사이의 값으로\n", "# 바꿔준다\n", "m = MinMaxScaler()\n", "min_max_mv = m.fit_transform(mv)\n", "pd.DataFrame(min_max_mv, columns=['d', 'b'])" ] }, { "cell_type": "code", "execution_count": null, "id": "00701a04-5d74-4175-99fe-bce9a7607f81", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": null, "id": "55afd9d5-f413-452d-8763-85d617a701cf", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": 19, "id": "fb8c4fb0-dfb4-471b-9cc5-c3844de41c1a", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
agedurationcampaignpdayspreviousy
0582611-100
1441511-100
233761-100
347921-100
4331981-100
\n", "
" ], "text/plain": [ " age duration campaign pdays previous y\n", "0 58 261 1 -1 0 0\n", "1 44 151 1 -1 0 0\n", "2 33 76 1 -1 0 0\n", "3 47 92 1 -1 0 0\n", "4 33 198 1 -1 0 0" ] }, "execution_count": 19, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df = pd.read_csv(\"../data_set/5.스케일링/bank_train_clean.csv\")\n", "df.head()" ] }, { "cell_type": "code", "execution_count": 20, "id": "b9d44017-9f58-4d58-a7fa-6587dda3a5d7", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Index(['age', 'duration', 'campaign', 'pdays', 'previous', 'y'], dtype='object')" ] }, "execution_count": 20, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.columns" ] }, { "cell_type": "code", "execution_count": 21, "id": "d33594bd-e4c6-4f35-b070-1eecc10c854e", "metadata": {}, "outputs": [], "source": [ "features = ['age', 'duration', 'campaign', 'pdays', 'previous']\n", "label = 'y'\n", "\n", "X, y = df[features], df[label]" ] }, { "cell_type": "code", "execution_count": 22, "id": "0128f64b-ace1-4387-9073-310acd63827b", "metadata": {}, "outputs": [], "source": [ "from sklearn.model_selection import train_test_split\n", "\n", "# 학습용 70%, 테스트용 30%\n", "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)" ] }, { "cell_type": "code", "execution_count": 26, "id": "52465bbc-e3af-4594-8ec8-9d090a8aa5c2", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "학습 데이터 : 0.9923847442095617\n", "test 데이터 : 0.8815246240047184\n" ] } ], "source": [ "from sklearn.ensemble import RandomForestClassifier\n", "\n", "# 머신 생성\n", "rfc = RandomForestClassifier()\n", "\n", "# 머신 학습\n", "rfc.fit(X_train, y_train);\n", "\n", "print( \"학습 데이터 : \", rfc.score(X_train, y_train) )\n", "\n", "# 학습된 머신 테스트 결과\n", "print( \"test 데이터 : \", rfc.score(X_test, y_test) )\n", "\n", "# 학습 데이터의 결과와 테스트 결과의 차이가 커지면\n", "# 과적합 되었다라고 말한다" ] }, { "cell_type": "code", "execution_count": null, "id": "f32f76e0-dce7-4bfc-85c0-06039fe6dc02", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": null, "id": "7d323808-1d19-4198-bee1-398bda3b5547", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": 28, "id": "15b62827-c8a7-4a45-b909-17b056bafad1", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "학습 데이터 : 0.9139570891395709\n", "test 데이터 : 0.8846210557357712\n" ] } ], "source": [ "from sklearn.neighbors import KNeighborsClassifier\n", "\n", "# 머신 생성\n", "kn = KNeighborsClassifier()\n", "\n", "# 머신 학습\n", "kn.fit(X_train, y_train)\n", "\n", "print( \"학습 데이터 : \", kn.score(X_train, y_train) )\n", "\n", "# 학습된 머신 테스트 결과\n", "print( \"test 데이터 : \", kn.score(X_test, y_test) )\n", "\n", "# 학습 데이터와 test 데이터 테스트 결과의\n", "# 차이 폭이 적으므로 좋은 알고리즘이다...." ] }, { "cell_type": "code", "execution_count": null, "id": "c744cdff-c398-492a-9ff2-2cb4ed9e9c87", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": null, "id": "3ee38aa7-e051-49a4-b18c-46dbf5638f1f", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": 30, "id": "49a313b4-1ef8-414d-bf2a-f8de8cfabfe3", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 1.60696496, 0.0110161 , -0.56935064, -0.41145311, -0.25194037],\n", " [ 0.28852927, -0.41612696, -0.56935064, -0.41145311, -0.25194037],\n", " [-0.74738448, -0.70736086, -0.56935064, -0.41145311, -0.25194037],\n", " ...,\n", " [ 2.92540065, 3.37379688, 0.72181052, 1.43618859, 1.05047333],\n", " [ 1.51279098, 0.97014641, 0.39902023, -0.41145311, -0.25194037],\n", " [-0.37068857, 0.39932797, -0.24656035, 1.4761376 , 4.52357654]])" ] }, "execution_count": 30, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# 데이터 스케일링\n", "sc = StandardScaler()\n", "sc.fit( X )\n", "X2 = sc.transform( X )\n", "X2" ] }, { "cell_type": "code", "execution_count": 31, "id": "fb66e42d-30ca-4681-9dbf-6c5660cedc9f", "metadata": {}, "outputs": [], "source": [ "X_train, X_test, y_train, y_test = train_test_split(X2, y, test_size=0.3)" ] }, { "cell_type": "code", "execution_count": 35, "id": "ed97e375-5588-4710-9423-0020b6c9977b", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "학습 데이터 : 0.9919423642051379\n", "test 데이터 : 0.8757003833677381\n" ] } ], "source": [ "# 머신 생성\n", "rfc = RandomForestClassifier()\n", "\n", "# 머신 학습\n", "rfc.fit(X_train, y_train);\n", "\n", "print( \"학습 데이터 : \", rfc.score(X_train, y_train) )\n", "\n", "# 학습된 머신 테스트 결과\n", "print( \"test 데이터 : \", rfc.score(X_test, y_test) )\n", "\n", "# 스케일링된 데이터로 다시 테스트" ] }, { "cell_type": "code", "execution_count": 36, "id": "99b350fe-2aa6-437c-88ad-6a065baee8ec", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "학습 데이터 : 0.9128195405567668\n", "test 데이터 : 0.8824830433500442\n" ] } ], "source": [ "# 머신 생성\n", "kn = KNeighborsClassifier()\n", "\n", "# 머신 학습\n", "kn.fit(X_train, y_train)\n", "\n", "print( \"학습 데이터 : \", kn.score(X_train, y_train) )\n", "\n", "# 학습된 머신 테스트 결과\n", "print( \"test 데이터 : \", kn.score(X_test, y_test) )\n", "\n", "# 스케일링된 데이터로 다시 테스트" ] }, { "cell_type": "markdown", "id": "00f394cc-9693-4089-9299-0a950f918ff6", "metadata": {}, "source": [ "### 스케일링을 사용하면 과적합을 줄여줄 수도 있다" ] }, { "cell_type": "code", "execution_count": null, "id": "ce16806f-c1d6-42c7-b7ec-5457c8b8619f", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": null, "id": "bcc20339-f56d-4d1f-a803-b1772eac2e96", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": 41, "id": "d337b3b2-db6a-4357-8f66-c4030eab0cb6", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0.51948052, 0.05307035, 0. , 0. , 0. ],\n", " [0.33766234, 0.03070354, 0. , 0. , 0. ],\n", " [0.19480519, 0.01545344, 0. , 0. , 0. ],\n", " ...,\n", " [0.7012987 , 0.22915819, 0.06451613, 0.21215596, 0.01090909],\n", " [0.50649351, 0.10329402, 0.0483871 , 0. , 0. ],\n", " [0.24675325, 0.07340382, 0.01612903, 0.21674312, 0.04 ]])" ] }, "execution_count": 41, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# fit_transform() 을 사용하여 스케일링\n", "X2 = m.fit_transform( X )\n", "X2" ] }, { "cell_type": "code", "execution_count": 38, "id": "0bee5ddb-a89b-4cec-840b-37f3b8c9f262", "metadata": {}, "outputs": [], "source": [ "X_train, X_test, y_train, y_test = train_test_split(X2, y, test_size=0.3)" ] }, { "cell_type": "code", "execution_count": 39, "id": "404054c2-6595-4795-a1b9-7ddefb8fd678", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "학습 데이터 : 0.9916895756311814\n", "test 데이터 : 0.8786493659687408\n" ] } ], "source": [ "# 머신 생성\n", "rfc = RandomForestClassifier()\n", "\n", "# 머신 학습\n", "rfc.fit(X_train, y_train);\n", "\n", "print( \"학습 데이터 : \", rfc.score(X_train, y_train) )\n", "\n", "# 학습된 머신 테스트 결과\n", "print( \"test 데이터 : \", rfc.score(X_test, y_test) )\n", "\n", "# 스케일링된 데이터로 다시 테스트" ] }, { "cell_type": "code", "execution_count": 40, "id": "fce36627-acea-4f34-9d22-3527fe4d65b6", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "학습 데이터 : 0.9158846020159889\n", "test 데이터 : 0.8817457976997936\n" ] } ], "source": [ "# 머신 생성\n", "kn = KNeighborsClassifier()\n", "\n", "# 머신 학습\n", "kn.fit(X_train, y_train)\n", "\n", "print( \"학습 데이터 : \", kn.score(X_train, y_train) )\n", "\n", "# 학습된 머신 테스트 결과\n", "print( \"test 데이터 : \", kn.score(X_test, y_test) )\n", "\n", "# 스케일링된 데이터로 다시 테스트" ] }, { "cell_type": "code", "execution_count": null, "id": "334c6973-096f-4b0f-b1c3-42b7c3f75b40", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": null, "id": "294ae389-831a-4806-8adb-4296d30954b9", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": 43, "id": "89824346-3e40-4093-8975-bee674e90fae", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
agedurationcampaignpdayspreviousy
age1.000000-0.0046480.004760-0.0237580.0012880.025155
duration-0.0046481.000000-0.084570-0.0015650.0012030.394521
campaign0.004760-0.0845701.000000-0.088628-0.032855-0.073172
pdays-0.023758-0.001565-0.0886281.0000000.4548200.103621
previous0.0012880.001203-0.0328550.4548201.0000000.093236
y0.0251550.394521-0.0731720.1036210.0932361.000000
\n", "
" ], "text/plain": [ " age duration campaign pdays previous y\n", "age 1.000000 -0.004648 0.004760 -0.023758 0.001288 0.025155\n", "duration -0.004648 1.000000 -0.084570 -0.001565 0.001203 0.394521\n", "campaign 0.004760 -0.084570 1.000000 -0.088628 -0.032855 -0.073172\n", "pdays -0.023758 -0.001565 -0.088628 1.000000 0.454820 0.103621\n", "previous 0.001288 0.001203 -0.032855 0.454820 1.000000 0.093236\n", "y 0.025155 0.394521 -0.073172 0.103621 0.093236 1.000000" ] }, "execution_count": 43, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# corr() : 데이터 간의 상관관계를 확인\n", "df.corr()" ] }, { "cell_type": "code", "execution_count": 45, "id": "58c68179-3c24-4736-b0c1-165cfccaf893", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 45, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "import seaborn as sns\n", "\n", "# annot = True : 상관관계 숫자를 출력\n", "sns.heatmap( df.corr(), annot=True )" ] }, { "cell_type": "code", "execution_count": 55, "id": "485f61ba-0a09-45ad-b515-63f26e8b1e72", "metadata": {}, "outputs": [], "source": [ "# features = ['age', 'duration', 'campaign', 'pdays', 'previous']\n", "# features = ['age', 'duration', 'campaign', 'previous']\n", "# features = ['age', 'campaign', 'previous']\n", "features = ['age', 'campaign', 'previous']\n", "label = 'y'\n", "X, y = df[features], df[label]\n", "\n", "sc = StandardScaler()\n", "sc.fit( X )\n", "X_scaler = sc.transform( X )\n", "\n", "X_train, X_test, y_train, y_test = train_test_split(X_scaler, y, test_size=0.3)" ] }, { "cell_type": "code", "execution_count": 56, "id": "eebfdd78-68b5-42d7-95b9-8d27335b239e", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "학습 데이터 : 0.8956615160994723\n", "test 데이터 : 0.8768799764081392\n", "학습 데이터 : 0.8799886245141719\n", "test 데이터 : 0.8695812444706577\n" ] } ], "source": [ "rfc = RandomForestClassifier()\n", "rfc.fit(X_train, y_train);\n", "print( \"학습 데이터 : \", rfc.score(X_train, y_train) )\n", "print( \"test 데이터 : \", rfc.score(X_test, y_test) )\n", "\n", "kn = KNeighborsClassifier()\n", "kn.fit(X_train, y_train)\n", "print( \"학습 데이터 : \", kn.score(X_train, y_train) )\n", "print( \"test 데이터 : \", kn.score(X_test, y_test) )" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.11.7" } }, "nbformat": 4, "nbformat_minor": 5 }