<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>DecoPark.log</title>
        <link>https://velog.io/</link>
        <description>취준생</description>
        <lastBuildDate>Wed, 09 Jun 2021 12:40:29 GMT</lastBuildDate>
        <docs>https://validator.w3.org/feed/docs/rss2.html</docs>
        <generator>https://github.com/jpmonette/feed</generator>
        <image>
            <title>DecoPark.log</title>
            <url>https://images.velog.io/images/jangsik-park/profile/43b5957c-50a5-4473-8754-1dc09896677b/명함_박장식 (1).jpg</url>
            <link>https://velog.io/</link>
        </image>
        <copyright>Copyright (C) 2019. DecoPark.log. All rights reserved.</copyright>
        <atom:link href="https://v2.velog.io/rss/jangsik-park" rel="self" type="application/rss+xml"/>
        <item>
            <title><![CDATA[3차원 그래프 그리기]]></title>
            <link>https://velog.io/@jangsik-park/3%EC%B0%A8%EC%9B%90-%EA%B7%B8%EB%9E%98%ED%94%84-%EA%B7%B8%EB%A6%AC%EA%B8%B0</link>
            <guid>https://velog.io/@jangsik-park/3%EC%B0%A8%EC%9B%90-%EA%B7%B8%EB%9E%98%ED%94%84-%EA%B7%B8%EB%A6%AC%EA%B8%B0</guid>
            <pubDate>Wed, 09 Jun 2021 12:40:29 GMT</pubDate>
            <description><![CDATA[<h2 id="❗️-n212-참고">❗️ N212 참고</h2>
<h3 id="1-plotly-이용하기">1. plotly 이용하기</h3>
<pre><code># plotly를 사용해서 상대적으로 간단히 그래프를 그릴 수도 있습니다.

import numpy as np
import plotly.express as px
import plotly.graph_objs as go
import itertools

def surface_3d(df, f1, f2, target, length=20, **kwargs):
    &quot;&quot;&quot;
    2특성 1타겟 선형모델평면을 시각화 합니다.

    df : 데이터프레임
    f1 : 특성 1 열 이름
    f2 : 특성 2 열 이름
    target : 타겟 열 이름
    length : 각 특성의 관측치 갯수

    &quot;&quot;&quot;

    # scatter plot(https://plotly.com/python-api-reference/generated/plotly.express.scatter_3d)
    plot = px.scatter_3d(df, x=f1, y=f2, z=target, opacity=0.5, **kwargs)

    # 다중선형회귀방정식 학습
    model = LinearRegression()
    model.fit(df[[f1, f2]], df[target])    

    # 좌표축 설정
    x_axis = np.linspace(df[f1].min(), df[f1].max(), length)
    y_axis = np.linspace(df[f2].min(), df[f2].max(), length)
    coords = list(itertools.product(x_axis, y_axis))

    # 예측
    pred = model.predict(coords)
    z_axis = pred.reshape(length, length).T

    # plot 예측평면
    plot.add_trace(go.Surface(x=x_axis, y=y_axis, z=z_axis, colorscale=&#39;Viridis&#39;))

    return plot</code></pre><p>이후</p>
<pre><code>surface_3d(
    train,
    f1=&#39;GrLivArea&#39;, 
    f2=&#39;OverallQual&#39;, 
    target=&#39;SalePrice&#39;,  
    title=&#39;House Prices&#39;
)</code></pre><h3 id="2-plt-이용하기">2. plt 이용하기</h3>
<pre><code>import matplotlib.pyplot as plt

style.use(&#39;seaborn-talk&#39;)
fig = plt.figure()

# for 3d plot
ax = fig.gca(projection=&#39;3d&#39;)

ax.scatter(train[&#39;GrLivArea&#39;], train[&#39;OverallQual&#39;], train[&#39;SalePrice&#39;])
ax.set_xlabel(&#39;GrLivArea&#39;, labelpad=12)
ax.set_ylabel(&#39;OverallQual&#39;, labelpad=10)
ax.set_zlabel(&#39;SalePrice&#39;, labelpad=20)

plt.suptitle(&#39;Housing Prices&#39;, fontsize=15)
plt.show()</code></pre>]]></description>
        </item>
        <item>
            <title><![CDATA[용어_머신러닝]]></title>
            <link>https://velog.io/@jangsik-park/%EC%9A%A9%EC%96%B4%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D</link>
            <guid>https://velog.io/@jangsik-park/%EC%9A%A9%EC%96%B4%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D</guid>
            <pubDate>Wed, 09 Jun 2021 12:15:08 GMT</pubDate>
            <description><![CDATA[<h2 id="머신러닝-부분에서-배운-용어-정리">머신러닝 부분에서 배운 용어 정리</h2>
<h3 id="1-bias">1. bias</h3>
<ul>
<li>오차의 편향이라고도 한다.</li>
<li>편향이 높다
  = train data에서 타겟값과 오차가 크다<pre><code>  = Underfitting(과소적합 상태)이다.</code></pre><h3 id="2-variance">2. variance</h3>
</li>
<li>분산이 높다
  = Overfitting 상태이다
  = 테스트데이터에서 오차가 많아진다.
  = 트레이닝데이터에서 오차가 0에 가깝다</li>
</ul>
<h3 id="3-overfitting">3. overfitting</h3>
<ul>
<li>훈련데이터에만 특수한 성질을 과하게 학습해 일반화를 못 한 것.</li>
<li>테스트데이터에서 오차가 커지는 현상</li>
</ul>
<h3 id="4-underfitting">4. Underfitting</h3>
<ul>
<li>훈련데이터에 과적합도 못하고
  일반화 성질도 학습하지 못 한 상태</li>
<li>훈련/테스트 데이터로부터 오차가 크게 발생한다.</li>
</ul>
<h3 id="5-ols-line">5. OLS line</h3>
<ul>
<li>&#39;회귀선&#39; 을 의미한다.</li>
</ul>
<h3 id="6-정규화-vs-표준화">6. 정규화 vs 표준화</h3>
<p><img src="https://images.velog.io/images/jangsik-park/post/0c9de5c0-fe0e-4f13-900d-584442dce93c/KakaoTalk_20210609_210959811.jpg" alt=""></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[머신러닝]]></title>
            <link>https://velog.io/@jangsik-park/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D</link>
            <guid>https://velog.io/@jangsik-park/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D</guid>
            <pubDate>Wed, 09 Jun 2021 11:45:31 GMT</pubDate>
            <description><![CDATA[<h2 id="기법">기법</h2>
<ul>
<li>Linear Regression</li>
<li><a href="https://velog.io/@jangsik-park/Multiplie-Linear-Regression">Mulitiple Linear Regression</a></li>
</ul>
<h2 id="이슈">이슈</h2>
<ul>
<li>train set과 test set을 나누는 이유</li>
<li>머신러닝에서 좋은 모델이란?</li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[Multiplie Linear Regression]]></title>
            <link>https://velog.io/@jangsik-park/Multiplie-Linear-Regression</link>
            <guid>https://velog.io/@jangsik-park/Multiplie-Linear-Regression</guid>
            <pubDate>Wed, 09 Jun 2021 11:37:33 GMT</pubDate>
            <description><![CDATA[<h3 id="1-회귀식">1. 회귀식</h3>
<blockquote>
<p>Y = b0 + b1x1 + b2x2</p>
</blockquote>
<h3 id="2-특징">2. 특징</h3>
<ul>
<li>기준모델, 단순선형 회귀 모델에 비해 error 값이 작다.
  (but)
  feature가 많다고 무조건 좋은 것이 아니다!!
  ex) overfitting...</li>
<li>통계적 유의성은 F-통계량으로 확인한다.
  (유의수준보다 작으면 회귀식이 유의하다)</li>
<li>feature importance를 구해서 어떤 feature를 사용할지 정할 수 있다.</li>
</ul>
<h3 id="3-코드">3. 코드</h3>
<pre><code>###Sklearn의 LinearRegration 사용하기
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error
model = LinearRegression()
model_Z = LinearRegression()

### 두개의 feature에 대해 train, test data 나누기
features = [&#39;bathrooms&#39;,&#39;sqft_living&#39;]
X_train = train[features]
X_test = test[features]
Y_train = train[&#39;price&#39;]
 Y_test = test[&#39;price&#39;]</code></pre><p>Scale 작업은 Must로 진행 해야한다.
표준화를 할지 정규화를 할지는 직접 해보고 결과가 더 좋은 것을 선택한다.</p>
<pre><code># 데이터 표준화 하기
# 교차 검증을 할 때는 Train Set에만 표준화를 해 줘야 한다.

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()

scaler.fit(X_train)
Z_Xtrain = scaler.transform(X_train)
Z_Xtest= scaler.transform(X_test)</code></pre><p>표준화된 데이터를 가지고 Model에 학습시키기.</p>
<pre><code># 표준화된 데이터를 사용해서 모델 학습
model_Z.fit(Z_Xtrain, Y_train)

#test셋에 대한 예측값 구하기
Y_pred2 = model_Z.predict(Z_Xtest)

#train set에 대한 예측값 구하기
Y_pred3 = model_Z.predict(Z_Xtrain) 

#mae 값 구하기
mae = mean_absolute_error(Y_test, Y_pred2)

print(f&#39;테스트세트에 대한 MAE 값은 {mae} 입니다.&#39;)</code></pre><h3 id="4-회귀모델을-평가하는-지표들">4. 회귀모델을 평가하는 지표들</h3>
<ul>
<li>MSE</li>
<li>MAE</li>
<li>RMSE</li>
<li>R-Squared = Coefficent of determinent</li>
</ul>
<h3 id="5-회귀분석의-성능판단">5. 회귀분석의 성능판단</h3>
<ul>
<li>모델의 정확도를 판단하고 싶다.
  : <strong>(R^2 사용)</strong></li>
<li>feature가 유효한지 알고 싶다.
  : <strong>(P-value 사용)</strong></li>
<li>어떤 feature가 설명력이 큰가?
  : <strong>(기울기 사용)</strong></li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[DS_정리 목차]]></title>
            <link>https://velog.io/@jangsik-park/DS%EC%A0%95%EB%A6%AC-%EB%AA%A9%EC%B0%A8</link>
            <guid>https://velog.io/@jangsik-park/DS%EC%A0%95%EB%A6%AC-%EB%AA%A9%EC%B0%A8</guid>
            <pubDate>Wed, 09 Jun 2021 07:58:56 GMT</pubDate>
            <description><![CDATA[<h2 id="데이터프레임-조작"><a href="https://velog.io/@jangsik-park/DataFrame-Manipulation">데이터프레임 조작</a></h2>
<h2 id="머신러닝">머신러닝</h2>
<h3 id="기법">기법</h3>
<ul>
<li>Linear Regression</li>
<li><a href="https://velog.io/@jangsik-park/Multiplie-Linear-Regression">Mulitiple Linear Regression </a></li>
</ul>
<h3 id="이슈">이슈</h3>
<ul>
<li>train set과 test set을 나누는 이유</li>
<li>머신러닝에서 좋은 모델이란?<h2 id="용어정리">용어정리</h2>
</li>
<li><a href="https://velog.io/@jangsik-park/%EC%9A%A9%EC%96%B4%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D">머신러닝 용어</a><h2 id="그래프-그리기">그래프 그리기</h2>
</li>
<li><a href="https://velog.io/@jangsik-park/3%EC%B0%A8%EC%9B%90-%EA%B7%B8%EB%9E%98%ED%94%84-%EA%B7%B8%EB%A6%AC%EA%B8%B0">3차원 그래프</a><h2 id="colab-github">colab, github</h2>
</li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[DataFrame Manipulation]]></title>
            <link>https://velog.io/@jangsik-park/DataFrame-Manipulation</link>
            <guid>https://velog.io/@jangsik-park/DataFrame-Manipulation</guid>
            <pubDate>Wed, 09 Jun 2021 07:56:49 GMT</pubDate>
            <description><![CDATA[<h1 id="🔥-목차">🔥 목차</h1>
<ul>
<li><p>데이터셋 불러오기</p>
<ul>
<li>[DataFrame 행렬 transepose하기 + sheet별로 불러 + Dataframe csv파일 저장.]</li>
</ul>
</li>
</ul>
<pre><code>- [첫번째 row를 column name으로 설정하기]
- [처음부터 숫자 형태로 불러오기] - thousands, names.
- [여러개의 엑셀 데이터 한번에 불러와서 합치기] - Concat.
- [Pandas 데이터 불러오기] - skiprows, sep=&#39;\t&#39;,replace</code></pre><ul>
<li><p>[데이터 dimension 확인하기]</p>
</li>
<li><p>[데이터의 결측치 확인하고, 0으로 대체 or 해당 행,열 제거]</p>
</li>
<li><p>[기존 DF에서 새로운 Feature 만들기]</p>
</li>
<li><p>[pandas에서 DataFrame 만들기]</p>
</li>
<li><p>[DataFrame내의 특정 자료 변환하기] - iloc, loc</p>
</li>
<li><p>[DataFrame내의 특정 자료 변환하기] - apply 함수</p>
</li>
<li><p>[DataFrame내의 특정 자료 변환하기] - 문자를 숫자로</p>
</li>
<li><p>[DataFrame내의 특정 자료 변환하기] - replace, 딕셔너리, Null 값 넣기</p>
</li>
<li><p>[DataFrame 합치기 및 특정 열 삭제] - concat, drop</p>
</li>
<li><p>[Mean imputation으로 결측치 채우기]</p>
</li>
<li><p>[데이터 합치기] - merge()</p>
</li>
<li><p>[특정 열에 속한 문자 지우기] - lambda 이용</p>
</li>
<li><p>인덱스 </p>
<ul>
<li><p>[인덱스 설정하기] - set_index()</p>
</li>
<li><p>[인덱스 초기화하기] -reset_index()</p>
</li>
</ul>
</li>
<li><p>tidy 형태 만들기 - melt()</p>
</li>
<li><p>column 명칭 변경하기 - rename()</p>
</li>
<li><p>[인덱스 숨기기] - style.hide_index()</p>
</li>
<li><p>[특정 column별로 평균내기] - groupby()</p>
</li>
<li><p>[각 열 조건에 맞는 index 찾아서 지우기]</p>
</li>
<li><p>[DF에서 랜덤하게 10개의 값 추출하기]</p>
</li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[Data 공부하는 팁 모음]]></title>
            <link>https://velog.io/@jangsik-park/Data-%EA%B3%B5%EB%B6%80%ED%95%98%EB%8A%94-%ED%8C%81-%EB%AA%A8%EC%9D%8C</link>
            <guid>https://velog.io/@jangsik-park/Data-%EA%B3%B5%EB%B6%80%ED%95%98%EB%8A%94-%ED%8C%81-%EB%AA%A8%EC%9D%8C</guid>
            <pubDate>Wed, 26 May 2021 09:50:12 GMT</pubDate>
            <description><![CDATA[<h1 id="how-to-study">How to study</h1>
<h2 id="기초수학">기초수학</h2>
<ul>
<li>calculus</li>
<li>선형대수학(MIT, Gilbert strang)</li>
<li>통계 ( Havard, Statistics 110)</li>
</ul>
<h2 id="머신러닝--딥러닝">머신러닝 &amp; 딥러닝</h2>
<ul>
<li>모두를 위한 딥러닝(성킴)</li>
<li>Machine Learning(Andrew Ng)</li>
<li>CS231n(stanford, computer vision)</li>
<li>CS224n(stanford, NLP)</li>
</ul>
<p><strong>출처 : 코드스테이츠 &#39;이성준&#39;님 발표 세미나 중</strong>
<strong>기록날짜 : 21.05.26</strong></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[DS_분석_Clustering]]></title>
            <link>https://velog.io/@jangsik-park/DS%EB%B6%84%EC%84%9DClustering</link>
            <guid>https://velog.io/@jangsik-park/DS%EB%B6%84%EC%84%9DClustering</guid>
            <pubDate>Wed, 26 May 2021 09:38:16 GMT</pubDate>
            <description><![CDATA[<h2 id="주제--clustering">주제 : Clustering</h2>
<h3 id="1-학습목표">1. 학습목표</h3>
<ul>
<li>Scree Plot의 의미를 이해할 수 있다.</li>
<li>Supervised / Unsupervised Learning의 차이를 설명할 수 있다.</li>
<li>K-means clustering을 설명 할 수 있다.</li>
</ul>
<h3 id="2-df-manipulation">2. DF manipulation</h3>
<ul>
<li>특정 칼럼 제거하기 : df.drop(&#39;컬럼명&#39;,axis= ...)</li>
<li>특정 칼럼 만들어서 값 채워주기 : df[&#39;column&#39;] = a</li>
</ul>
<h3 id="3-용어정리">3. 용어정리</h3>
<ul>
<li>Scree Plots</li>
<li>Machine Learning</li>
<li>Clustering</li>
<li>similarity</li>
<li>K-means Clustering</li>
<li>The Eyeball Method , Metrics</li>
<li>Elbow methods</li>
</ul>
<h3 id="4-이건-알고-가자">4. 이건 알고 가자</h3>
<ul>
<li>완벽한 알고리즘은 없다</li>
<li>clustering은 어떤 의미를 갖나요?</li>
</ul>
<h3 id="5-내용">5. 내용</h3>
<h4 id="1-scree-plots">(1) Scree Plots</h4>
<blockquote>
</blockquote>
<p>🌟 <strong>what?</strong></p>
<ul>
<li>주성분의 개수를 정하는 방법이다 = PCA를 몇 차원으로 해야할까?<blockquote>
</blockquote>
🌟 <strong>How?</strong></li>
<li>Scree Plots을 그렸을 때, 기울기가 급격하게 변하는 구간을 선택한다.</li>
<li>Eigenvalue의 누적값이 설명되는 분산의 70~80% 정도면 무난한다고 생각한다.</li>
</ul>
<h4 id="2-machine-learning">(2) Machine Learning</h4>
<blockquote>
</blockquote>
<p>🌟 what?</p>
<ul>
<li>기계학습</li>
<li>supervised learning , unsupervised learning , reignforceement learning이 포함된다</li>
</ul>
<blockquote>
</blockquote>
<p>🌟 Supervised Learning?</p>
<ul>
<li><strong>개념 :</strong> input data(트레이닝 데이터)에 답이 있을 때 사용할 수 있다.</li>
<li><strong>개념 :</strong> 대표적으로 Classification(분류), Prediction(회귀)가 있다.<blockquote>
</blockquote>
</li>
<li><strong>Classification(분류)</strong><blockquote>
</blockquote>
<ul>
<li>주어진 데이터의 카테고리 혹은 클래스를 <strong>예측</strong> 하는데 사용된다.</li>
<li>ex) x는 동그라미일까? 네모일까? 알아 맞춰봐!!!<blockquote>
</blockquote>
</li>
</ul>
</li>
<li><strong>Prediction(회귀)</strong><blockquote>
</blockquote>
<ul>
<li>continuous한 데이터를 바탕으로 결과를 예측하기 위해 사용한다.</li>
<li><strong>continuous한 데이터??</strong></li>
</ul>
</li>
</ul>
<blockquote>
</blockquote>
<p>🌟 Unsupervised Learning?</p>
<ul>
<li><strong>개념</strong> : 데이터의 연관된 feature를 바탕으로 유사한 그룹을 생성합니다.</li>
<li>차원축소 = Dimensionality Reduction이 사용된다</li>
<li>연관 규칙 학습 = Association Rule Learning이 사용된다.<blockquote>
<ul>
<li>데이터셋의 feature들의 관계를 발견하는 방법이다.</li>
</ul>
</blockquote>
<ul>
<li>feature-output이 아닌 feature-feature이다 <strong>??</strong></li>
</ul>
</li>
</ul>
<blockquote>
</blockquote>
<p>🌟 Reinforcement Learning?</p>
<blockquote>
</blockquote>
<ul>
<li>개념 :  기계가 좋은 행동에 대해서는 보상, 그렇지 않은 행동에는 처벌이라는 피드백을 통해서 행동에 대해 학습해 나가는 형태</li>
</ul>
<h4 id="3-clustering--군집">(3) Clustering = 군집</h4>
<blockquote>
<p>🌟 <strong>What?</strong></p>
</blockquote>
<ul>
<li>Unsupervised Learning의 한 종류이다.<blockquote>
</blockquote>
🌟 <strong>목적?</strong></li>
<li>클러스터링을 통해 주어진 데이터들이 얼마나, 어떻게 유사한지를 알수 있다.</li>
<li>때문에 주어진 데이터셋을 요약/정리하는데 있어 매우 효율적인 방법이다.</li>
<li><strong>하지만</strong>, 정답을 보장하지 않기에 예측을 위한 모델링 보다는 EDA를 위한 방법으로써 많이 쓰인다.<blockquote>
</blockquote>
🌟 <strong>종류?</strong></li>
<li>Hierarchical = 계층<blockquote>
</blockquote>
🌟 <strong>Hard vs Soft Clustering</strong></li>
<li>Hard clustering : 데이터가 하나의 Cluster에만 할당된다.</li>
<li>Soft clustering : 데이터가 여러 cluster에 확률을 가지고 할당된다.</li>
<li>일반적으로 Hard Clustering을 Clustering이라고 말한다.</li>
</ul>
<h4 id="4-similiarity--유사도">(4) Similiarity = 유사도</h4>
<blockquote>
<p>🌟 <strong>what?</strong></p>
</blockquote>
<ul>
<li>벡터들끼리의 거리가 어떻게 되나? 가깝나? 먼가?<blockquote>
</blockquote>
🌟 <strong>종류</strong></li>
<li>Euclidean</li>
<li>Cosline</li>
<li>Jaccard</li>
<li>Edit Distance</li>
<li>Etc</li>
<li><strong>각 목적에 따라서 다른 방식이 사용된다!!</strong></li>
</ul>
<h4 id="5-k-means-클러스터링">(5) K-means 클러스터링</h4>
<blockquote>
<p>🌟 <strong>과정</strong></p>
</blockquote>
<ul>
<li>1) k개의 랜덤한 데이터를 cluster의 중심점으로 설정한다.</li>
<li>2) 주어진 데이터와 중심점과의 거리를 계산한다.</li>
<li>3) 거리가 가장 짧은 것을 선택하면, 데이터가 어느 Cluster에 속하는지 알 수 있다.</li>
<li>4) Cluster가 새로 형성되면, 평균값을 이용해서 또 다시 중심점을 구한다.</li>
<li>5) 새로운 중심점을 이용해서 2) ~ 3) 을 반복한다</li>
<li>6) 더 이상 Cluster에 유의미한 변화가 없을 때 중단한다.<blockquote>
</blockquote>
🌟 <strong>이 과정을 내가 다 만들어?</strong></li>
<li>아니다! Scikit-learn에서 라이브러리 불러올 수 있다.
<code>from sklearn.cluster import KMeans</code>
<code>kmeans = KMeans(n_cluster = x)</code>
<code>kmeans.fit(x)</code>
<code>labels = kmeans.labels</code><blockquote>
</blockquote>
🌟 <strong>K-means에서 K는 어떻게 구하는거야?</strong></li>
<li>The Eyeball Method : 사람이 주관적인 판단을 통해 지정한다.</li>
<li>Metrics : 객관적인 지표를 설정해서, 최적화된 K를 선택한다. ex) Elbow methods</li>
</ul>
<h4 id="6-elbow-methods">(6) Elbow methods</h4>
<blockquote>
</blockquote>
<p>🌟 <strong>what??</strong></p>
<ul>
<li>K-means Clustering에서 K를 구하는 방법 중에 하나.<blockquote>
</blockquote>
🌟 <strong>How??</strong></li>
<li>1) Kmeans를 K개로 진행해서</li>
<li>2) 각각의 경우에 데이터끼리의 거리의 합 구한다.</li>
<li>3) 거리의 합이 작은 것을 선택한다.</li>
</ul>
<h4 id="7-마치며">(7) 마치며</h4>
<blockquote>
</blockquote>
<h2 id="🌟-완벽한-알고리즘은-없다">🌟 <strong>완벽한 알고리즘은 없다</strong></h2>
<ul>
<li>k-means 말고도 상당히 많은 clustering 알고리즘들이 있으며<blockquote>
</blockquote>
각자 풀고자 하는 문제에 대해서 최적화되어있습니다.<blockquote>
</blockquote>
그러나, 최적화된 문제를 제외한 다른부분에는 <strong>장점을 보이지 못한다는 단점도 있습니다.</strong></li>
</ul>
<blockquote>
<h2 id="🌟-때문에">🌟 때문에...</h2>
</blockquote>
<ul>
<li>다양한 방법론에 대해 연구를 하고 알고 있어야 한다.</li>
<li>데이터의 특성을 알아야, 다양한 방법들을 선택할 수 있다. 그러므로 <strong>도메인 지식</strong>을 키워야 한다<strong>!!</strong></li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[DS_가설검정]]></title>
            <link>https://velog.io/@jangsik-park/CodeStatesDS-3%EC%9D%BC%EC%B0%A8-276ll6aw</link>
            <guid>https://velog.io/@jangsik-park/CodeStatesDS-3%EC%9D%BC%EC%B0%A8-276ll6aw</guid>
            <pubDate>Wed, 19 May 2021 01:20:20 GMT</pubDate>
            <description><![CDATA[<h2 id="주제--가설검정">주제 : 가설검정</h2>
<h3 id="1-학습-목표">1. 학습 목표</h3>
<ul>
<li>Estimation / Sampling의 목적과 방법에 대해서 이해한다.</li>
<li>가설검정에 대해서 이해한다.</li>
<li>T-test의 목적과 사용예시를 설명할 수 있다.</li>
</ul>
<h3 id="2-과제-질문">2. 과제 질문</h3>
<ul>
<li>[Pandas 데이터 불러오기] - skiprows, sep=&#39;\t&#39;,replace</li>
<li>[Pandas DF 조작] - 각 열 조건에 맞는 index 찾아서 지우기</li>
<li>[Pandas DF 조작] - DF에서 랜덤하게 10개의 값 추출하기</li>
<li>[Pandas DF 조작] - reset_index()</li>
</ul>
<h3 id="3-과제-풀이">3. 과제 풀이</h3>
<h4 id="1-skiprows-sept-replace">(1) skiprows, sep=&#39;\t&#39;, replace</h4>
<pre><code>df = pd.read_csv(myurl,sep = &#39;\t&#39;,thousands=&#39;,&#39;, skiprows = 1)
df=df.replace({&#39;-&#39;:0})</code></pre><blockquote>
<p>🌟 sep=&#39;\t&#39;를 통해 공백을 구분자로 사용할 수 있다.
🌟 skiprows를 통해 원하는 행을 빼고 출력할 수 있다.
🌟 replace({&#39;-&#39;:&#39;0&#39;}) 에서 </p>
</blockquote>
<ul>
<li>{ } 가 쓰인 다는 것과, <ul>
<li>이전에는 x.replace(&#39;,&#39; , &#39; &#39;)로 썼었다는 것 알아두기. (차이점이 있나??)</li>
</ul>
</li>
</ul>
<h4 id="2-각-열-조건에-맞는-index-찾아서-지우기">(2) 각 열 조건에 맞는 index 찾아서 지우기</h4>
<pre><code>seoul = df[df[&#39;자치구&#39;]==&#39;서울시&#39; | df[&#39;자치구&#39;] == &#39; 공원녹지사업소&#39;].index

df=df.drop(seoul)</code></pre><blockquote>
<p>🌟 새로운 변수에 각 열 조건에 맞는 &#39;행&#39;의 index 구하기 
🌟 drop을 이용해서 df에서 seoul에 해당하는 열 삭제하기</p>
</blockquote>
<h4 id="3-df에서-랜덤하게-10개의-값-추출하기">(3) DF에서 랜덤하게 10개의 값 추출하기</h4>
<pre><code>import numpy as np
np.random.seed(123)

rnd_city = np.random.choice(df[&#39;자치구&#39;], size = 10) # 특정 열에서 랜덤하게 10개의 값 추출하기
rnd_city</code></pre><blockquote>
<p>🌟 numpy 불러오기
🌟 seed값 설정하기
(seed값이 같으면 랜덤 결과가 같다)
🌟 np.random.choice 이용해서 DF에서 랜덤하게 값 추출하기</p>
</blockquote>
<h4 id="4-인덱스-초기화---reset_index">(4) 인덱스 초기화 - reset_index()</h4>
<pre><code>df = df.reset_index() </code></pre>]]></description>
        </item>
        <item>
            <title><![CDATA[CodeStates_DS Sprint1]]></title>
            <link>https://velog.io/@jangsik-park/CodeStatesDS-Sprint1</link>
            <guid>https://velog.io/@jangsik-park/CodeStatesDS-Sprint1</guid>
            <pubDate>Wed, 12 May 2021 04:25:31 GMT</pubDate>
            <description><![CDATA[<p>[코드스테이츠 1주차 회고]</p>
<p>STAR기법 = situation + Trouble + Action + Result</p>
<p>(사실)</p>
<ul>
<li>1주차에는 EDA, FeatureEngineering,데이터조작, 미분에 대한 내용을 배웠다.</li>
</ul>
<p>(문제점)</p>
<ul>
<li>지금의 난 4일치 배운 Pandas 명령어나, 모든 내용이 머릿 속에서 뒤엉켜 있는 상태이다.
그리고, 명령어의 구체적인 사용법이나 언제 () 가 사용되고 [],{}가 사용되어야 하는지 헷갈린다.</li>
</ul>
<p>(긍정)</p>
<ul>
<li>처음 배울 때 보다, 과제 하는데 시간도 줄어들고 Codestates의 커리큘럼에 많이 익숙해졌다는 것은 긍정적이다.</li>
</ul>
<p>(문제 해결책)</p>
<ul>
<li><p>현재는, 배운 내용을 그날 블로그에 정리하는 것만으로 복습을 하고 있다.
시간을 조금 더 만들고 최적의 복습 방법을 고민해봐야 겠다는 생각이 든다.</p>
</li>
<li><p>일목요연하게 정리한 나만의 노트가 필요하다고 생각한다.</p>
</li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[DS_ Data Manipulation]]></title>
            <link>https://velog.io/@jangsik-park/CodeStatesDS-3%EC%9D%BC%EC%B0%A8</link>
            <guid>https://velog.io/@jangsik-park/CodeStatesDS-3%EC%9D%BC%EC%B0%A8</guid>
            <pubDate>Mon, 10 May 2021 14:38:16 GMT</pubDate>
            <description><![CDATA[<h2 id="주제--data-manipulation">주제 : Data Manipulation</h2>
<h3 id="1-학습-목표">1. 학습 목표</h3>
<ul>
<li>pandas를 통해 데이터를 <code>concat</code> / <code>merge</code> 할 수 있다.</li>
<li>tidy 데이터 에 대한 개념을 이해한다</li>
<li><code>melt</code>와 <code>pivot</code> / <code>pivot_table</code> 함수를 사용하여 wide와 tidy 형태의 데이터를 서로 변환 할 수 있다.</li>
</ul>
<h3 id="2-과제-질문">2. 과제 질문</h3>
<ul>
<li>여러개의 엑셀 데이터 한번에 불러와서 합치기 - Concat</li>
<li>데이터 합치기 - merge()</li>
<li>한글 폰트 깨짐 현상 해결하기 - 폰트설정, 마이너스 폰트 설정, 글씨 선명도</li>
<li>특정 열에 속한 문자 지우기 - lambda 이용</li>
<li>인덱스 설정하기 - set_index()</li>
<li>tidy 형태 만들기 - melt()</li>
<li>column 명칭 변경하기 - rename()</li>
<li>인덱스 숨기기 - style.hide_index()</li>
<li>구글 코랩에서 드라이브에 있는 파일 경로 보기</li>
<li>특정 column별로 평균내기 - groupby()</li>
</ul>
<h3 id="3-과제-명령어-모음">3. 과제 명령어 모음</h3>
<h4 id="1-여러개의-엑셀-데이터-한번에-불러와서-합치기---concat">(1) 여러개의 엑셀 데이터 한번에 불러와서 합치기 - Concat</h4>
<pre><code>def mydf(myurl):
  df = pd.read_csv(urlhead + myurl).transpose()
  new_header = df.iloc[0]
  df=df[1:] #df 1행부터 재설정
  df.columns = new_header
  return df[-1 :] # 제일 최근 분기의 데이터를 뽑아 오기 위한 과정</code></pre><blockquote>
<p>🌟 csv파일을 불러옴과 동시에 transpose() 수행
🌟 header를 설정하는 방법 2 (1은 앞에서 정리함)</p>
</blockquote>
<pre><code>df = pd.concat([mydf(&#39;000080.csv&#39;),mydf(&#39;000890.csv&#39;), mydf(&#39;005300.csv&#39;), mydf(&#39;027740.csv&#39;), mydf(&#39;035810.csv&#39;), mydf(&#39;136480.csv&#39;)])
df = df.reset_index()  
df = df.drop(df.columns[0], axis=1)</code></pre><blockquote>
<p>🌟 함수와 Concat을 이용해서 한번에 데이터 합치기
🌟 인덱스 초기화 하기
🌟 컬럼이 0인 부분의 열 제거하기</p>
</blockquote>
<h3 id="2-데이터-합치기---merge">(2) 데이터 합치기 - merge()</h3>
<pre><code>df2= left.merge(right, how=&#39;left&#39;)</code></pre><blockquote>
<p>🌟 pandas merge option</p>
</blockquote>
<p>left</p>
<blockquote>
</blockquote>
<pre><code>왼쪽 테이블은 그대로,    
합쳐지는 테이블은 공통부분은 옮겨지고
공통되지 않은 것은 null값 부여.</code></pre><blockquote>
</blockquote>
<p>right</p>
<blockquote>
</blockquote>
<pre><code>오른쪽 테이블은 그대로,    
합쳐지는 테이블은 공통부분은 옮겨지고
공통되지 않은 것은 null값 부여.</code></pre><blockquote>
</blockquote>
<p>outer</p>
<blockquote>
</blockquote>
<pre><code>좌, 우측 테이블의 모든 데이터를 읽어온다.
이때, 중복된 데이터는 삭제한다</code></pre><blockquote>
</blockquote>
<p>inner</p>
<blockquote>
</blockquote>
<pre><code>교집합</code></pre><blockquote>
</blockquote>
<p>cross: </p>
<blockquote>
</blockquote>
<pre><code>creates the cartesian product from both frames, preserves the order of the left keys.</code></pre><blockquote>
<pre><code>두개의 테이블의 행 * 행 만큼의 행으로 이루어진 테이블이 만들어진다</code></pre></blockquote>
<p><a href="https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html">pandas 공식홈페이지</a></p>
<h4 id="3-한글-폰트-깨짐-현상-해결하기---폰트설정-마이너스-폰트-설정-글씨-선명도">(3) 한글 폰트 깨짐 현상 해결하기 - 폰트설정, 마이너스 폰트 설정, 글씨 선명도</h4>
<pre><code>import matplotlib as plt
plt.rc(&#39;font&#39;, family= &#39;NanumGothic&#39;) ## 나눔고딕 폰트로 설정
plt.rc(&#39;axes&#39;, unicode_minus=False) ## 마이너스 폰트 설정
%config InlineBackend.figure_format = &#39;retina&#39; # 글씨 선명하게 출력하는 설정</code></pre><blockquote>
<p> 🌟 설정했음에도 폰트가 깨진다면??</p>
</blockquote>
<h4 id="4-특정-열에-속한-문자-지우기---lambda-이용">(4) 특정 열에 속한 문자 지우기 - lambda 이용</h4>
<pre><code>df[&#39;매출액&#39;]=df[&#39;매출액&#39;].apply(lambda x : x.replace(&#39;,&#39;,&#39;&#39;))</code></pre><blockquote>
<p>🌟 lambda 함수는 일시적으로만 썼다가 지워지는 함수.</p>
</blockquote>
<h4 id="5-인덱스-설정하기---set_index">(5) 인덱스 설정하기 - set_index()</h4>
<pre><code>df.set_index(&#39;종목명&#39;, inplace=True)</code></pre><blockquote>
<p>🌟 특정 열로 인덱스를 설정할 수 있다</p>
</blockquote>
<h3 id="6-tidy-형태-만들기---melt">(6) tidy 형태 만들기 - melt()</h3>
<pre><code>df_tidy = df.melt(id_vars=[&#39;종목명&#39;], value_vars=[&#39;매출액&#39;,&#39;자산총계&#39;,&#39;EPS(원)&#39;])</code></pre><blockquote>
<p>🌟 종목명에 따른 value_vars의 Observation값 구함.
🌟 tidy 형태는 Seaborn과 같은 시각화 라이브러리에서 유용하게 쓰인다.</p>
</blockquote>
<h3 id="🔥-참고-pivot_table-tidy---wide">🔥 참고 pivot_table: Tidy -&gt; Wide</h3>
<pre><code># 파라미터에 대한 설명
# index: unique identifier
# columns: &quot;wide&quot; 데이터에서 column별로 다르게 하고자 하는 값.
# values: 결과값이 들어가는 곳 (wide 데이터프레임의 내용에 들어갈 값)
wide = tidy1.pivot_table(index = &#39;row&#39;, columns = &#39;column&#39;, values = &#39;value&#39;)
wide</code></pre><blockquote>
<p>🌟  pivot_table을 통해 wide 구조로 바꿀 수도 있다</p>
</blockquote>
<h3 id="7-column-명칭-변경하기---rename">(7) column 명칭 변경하기 - rename()</h3>
<pre><code>df_tidy = df_tidy.rename(
    columns = {
        &#39;variable&#39;:&#39;Feature&#39;,
    }
)</code></pre><blockquote>
<p>🌟 이름 바꾸는 방법 헷갈리네..??
🌟 df.columns([&#39; ~~&#39;]) 도 있었던 것 같은데?</p>
</blockquote>
<h3 id="8-인덱스-숨기기---stylehide_index">(8) 인덱스 숨기기 - style.hide_index()</h3>
<pre><code>df2.style.hide_index()</code></pre><blockquote>
<p>🌟 colab에서는 안 됐었는데..?</p>
</blockquote>
<h3 id="9-구글-코랩에서-드라이브에-있는-파일-경로-보기">(9) 구글 코랩에서 드라이브에 있는 파일 경로 보기</h3>
<blockquote>
<p>🌟 왼쪽에서 아이콘 클릭으로 마운트를 먼저 해주자!
🌟 content -&gt; drive -&gt; mydrive에서 원하는 파일 찾기
🌟 파일 우클릭 후 경로 복사</p>
</blockquote>
<h3 id="10-특정-column별로-평균내기---groupby">(10) 특정 column별로 평균내기 - groupby()</h3>
<pre><code>df5.groupby(&#39;테마&#39;).mean()</code></pre><blockquote>
<p>🌟 테마를 기준으로 다른 모든 숫자형 값들에 대해 컬럼별로 평균을 구한다 </p>
</blockquote>
<ul>
<li><p>Before
<img src="https://images.velog.io/images/jangsik-park/post/ea359768-19d3-40f5-8b59-d113bd34f4b5/image.png" alt=""></p>
</li>
<li><p>After
<img src="https://images.velog.io/images/jangsik-park/post/d11bf240-f296-46a0-bdc5-a484a6aa1940/image.png" alt=""></p>
</li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[DS_Feature Engineering]]></title>
            <link>https://velog.io/@jangsik-park/codestatesDS-2%EC%9D%BC%EC%B0%A8</link>
            <guid>https://velog.io/@jangsik-park/codestatesDS-2%EC%9D%BC%EC%B0%A8</guid>
            <pubDate>Fri, 07 May 2021 13:36:29 GMT</pubDate>
            <description><![CDATA[<h2 id="주제--feature-engineering">주제 : Feature Engineering</h2>
<h3 id="1-feeture-engineering">1. Feeture Engineering?</h3>
<ul>
<li>what?
DF의 Feature들을 조합해서 새로운 Feature를 만드는 것
ex) BMI 지수 = 몸무게/~~</li>
<li>why?
더 좋은 퍼포먼스를 얻기 위해, 새롭고 의미있는 데이터를 제공하려고 하기 때문이다.</li>
</ul>
<h3 id="2-과제-질문">2. 과제 질문</h3>
<ul>
<li>read_csv에서의 설정 - thousands, names</li>
<li>기존 DF에서 새로운 Feature 만들기</li>
<li>pandas에서 DataFrame 만들기</li>
<li>DataFrame내의 특정 자료 변환하기 - iloc, loc</li>
<li>DataFrame내의 특정 자료 변환하기 - apply 함수</li>
<li>DataFrame내의 특정 자료 변환하기 - 문자를 숫자로</li>
<li>DataFrame내의 특정 자료 변환하기 - replace, 딕셔너리, Null 값 넣기</li>
<li>DataFrame 합치기 및 특정 열 삭제 - concat, drop</li>
<li>Mean imputation으로 결측치 채우기</li>
</ul>
<h3 id="3-과제-명령어-모음">3. 과제 명령어 모음</h3>
<h4 id="1-read_csv에서의-설정---thousands-names">(1) read_csv에서의 설정 - thousands, names</h4>
<pre><code>url=www.~~~
headers = [&#39;a&#39;,&#39;b&#39;~~]

df= pd.read_csv(url, names=headers , thousands= &#39;,&#39;)</code></pre><blockquote>
<p>🌟 csv파일을 불러올 때 다양한 조건이 있다
🌟 names 조건을 통해 column을 설정할 수 있다.
🌟 thousands= &#39;,&#39; 설정을 통해 ,(콤마)를 없애고 문자열로 불러 오는 것을 사전에 방지할 수 있다.</p>
</blockquote>
<h4 id="2-기존-df에서-새로운-feature-만들기">(2) 기존 DF에서 새로운 Feature 만들기</h4>
<pre><code>student_card = pd.DataFrame({&#39;ID&#39;:[20190103, 20190222, 20190531], &#39;name&#39;:[&#39;Kim&#39;, &#39;Lee&#39;, &#39;Jeong&#39;] 
,&#39;class&#39;:[&#39;H&#39;, &#39;W&#39;, &#39;S&#39;]}, index = [&#39;a&#39;, &#39;b&#39;, &#39;c&#39;])</code></pre><blockquote>
<p> 🌟 &#39;영업이익률2라는 새로운 Column을 만들 수 있다.</p>
</blockquote>
<h4 id="3-pandas에서-dataframe-만들기">(3) pandas에서 DataFrame 만들기</h4>
<pre><code>df2 = pd.DataFrame({&quot;구분&quot;:[&#39;18년&#39;,&#39;19년&#39;], &quot;종가&quot;:[101500,93800], &quot;발행주식수&quot;:[137292497,137292497    ],&quot;시가총액&quot;:[13935188445500,12878036218600], &quot;시장점유율&quot;:[62.0,63.5]})
df2</code></pre><blockquote>
<p>🌟 DataFrame을 직접 만들 때 사용한다.</p>
</blockquote>
<h4 id="4-dataframe내의-특정-자료-변환하기---iloc-loc">(4) DataFrame내의 특정 자료 변환하기 - iloc, loc</h4>
<pre><code>df.dtypes

df.iloc[0,1] = 12578</code></pre><blockquote>
<p>🌟 df.dtypes를 통해 각 컬럼들의 형태를 알 수 있다.
🌟 인덱스번호로 각 데이터에 접근할 수 있는 iloc[]를 사용해서 값을 변경 할 수 있다.</p>
</blockquote>
<p><a href="https://azanewta.tistory.com/34">iloc과 loc의 사용 방법, 차이</a></p>
<p><a href="https://forlater.tistory.com/278">iloc과 loc을 사용한 값 변경</a></p>
<h3 id="5-dataframe내의-특정-자료-변환하기---apply-함수를-이용하여-콤마-없애기">(5) DataFrame내의 특정 자료 변환하기 - apply 함수를 이용하여 콤마 없애기</h3>
<pre><code>def toint(string):
  return int(string.replace(&#39;,&#39;,&#39;&#39;)) 

  ## df[&#39;colname&#39;].str.replace(&#39;,&#39;, &#39;&#39;).astype(float) ##

for i in df.columns:
  if df[i].astype== str:
    df[i] = df[i].apply(toint)

df</code></pre><blockquote>
<p>🌟 replace함수를 이용해서 문자열의 ,를 없앨 수 있다
🌟 for문과 apply 함수를 이용해서 DF내의 각 컬럼들에 대해 ,를 없애준다.</p>
</blockquote>
<p>🔥 for문에서 df4.columns를 사용할 수 있는 Tip!
🔥 apply함수는 다른 함수를 불러 옴 Tip!</p>
<pre><code>df_tidy[&#39;value&#39;]=df_tidy[&#39;value&#39;].apply(lambda x : x.replace(&#39;,&#39;,&#39;&#39;)) </code></pre><blockquote>
<p>🌟 또 다른 방법으로 콤마를 제거하는 문법이다. 
 ??????? (여기서 lambda x : x.~) 의 의미는????????</p>
</blockquote>
<h3 id="6-dataframe내의-특정-자료-변환하기---문자를-숫자로">(6) DataFrame내의 특정 자료 변환하기 - 문자를 숫자로</h3>
<pre><code>df4=df4.apply(pd.to_numeric)
df4.dtypes

df4=df4[&#39;a&#39;].apply(pd.to_numeric)</code></pre><blockquote>
<p>🌟 pd.to_numeric 함수를 통해 숫자형으로 변경 가능하다.
🌟 특정열만 선택해서 변경도 가능하다.</p>
</blockquote>
<h3 id="7-dataframe내의-특정-자료-변환하기---replace-딕셔너리-null-값">(7) DataFrame내의 특정 자료 변환하기 - replace, 딕셔너리, Null 값</h3>
<pre><code>import numpy as np
df7.replace({&#39;당기순이익&#39;:1183},{&#39;당기순이익&#39;: np.NaN})</code></pre><blockquote>
<p>🌟 numpy 라이브러리를 이용해서 null값을 불러온다
🌟 replace() 함수를 이용해서 값을 변환
🌟 딕셔너리 {&#39;컬럼&#39; : 데이터} 이용해서 변환할 데이터 선정</p>
</blockquote>
<h3 id="8-dataframe-합치기-및-특정-열-삭제---concat-drop">(8) DataFrame 합치기 및 특정 열 삭제 - concat, drop</h3>
<pre><code>df7= pd.concat([df4,df5],axis=1) 
df7</code></pre><blockquote>
<p>🌟 axis = 1 이 컬럼 기준이라는 의미이다. 
🌟 axis=0은 행 기준</p>
</blockquote>
<h3 id="9-mean-imputation으로-결측치-채우기">(9) Mean imputation으로 결측치 채우기</h3>
<pre><code>df7.fillna(df.mean())

df.where(pd.notnull(df),df.mean(),axis=&#39;columns&#39;) </code></pre><blockquote>
<p>🌟 1일째는 결측값을 0으로 바꿔주는 것을 했었는데 평균값 등으로도 바꿔 줄 수 있다는 것을 알았다.</p>
</blockquote>
<p><a href="https://rfriend.tistory.com/265">DataFrame의 특정 칼럼 값 교체하기</a></p>
<p><a href="https://m.blog.naver.com/hancury/220396495672">결측값 대체 이론 = imputation</a></p>
<p><a href="https://rfriend.tistory.com/262">결측값 대체 방법</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[DS_EDA]]></title>
            <link>https://velog.io/@jangsik-park/CodstatesDS1%EC%9D%BC%EC%B0%A8</link>
            <guid>https://velog.io/@jangsik-park/CodstatesDS1%EC%9D%BC%EC%B0%A8</guid>
            <pubDate>Thu, 06 May 2021 12:58:38 GMT</pubDate>
            <description><![CDATA[<h2 id="주제--eda">주제 : EDA</h2>
<h3 id="과제-주요-문제-정리">과제 주요 문제 정리</h3>
<ul>
<li>데이터셋 불러오기 + DataFrame 행렬 transepose하기 + sheet별로 불러 + Dataframe csv파일 저장</li>
<li>첫번째 row를 column name으로 설정하기</li>
<li>데이터 dimension 확인하기</li>
<li>데이터의 결측치 확인하고, 0으로 대체 or 해당 행,열 제거</li>
<li>graphic EDA : 특정 column값을 barplot으로 나타내기 + trouble shooting</li>
<li>graphic EDA : qq plot 그리기 = 데이터의 분포 확인하기</li>
<li>graphic EDA : box plot 그리기</li>
<li>Non graphic EDA : summary statistics, cross-tabulation</li>
</ul>
<hr>
<h3 id="과제에-사용된-명령어들-모음">과제에 사용된 명령어들 모음</h3>
<h4 id="1-데이터셋-불러오기">1. 데이터셋 불러오기</h4>
<blockquote>
<pre><code>ktng_data_url= &#39;https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/stocks/Travel.xlsx&#39;
df1 = pd.read_excel(ktng_data_url, sheet_name=0)
df1 = df1.T
df1.head()
df1.to_csv(&quot;df1.csv&quot;, mode=&#39;w&#39;)</code></pre></blockquote>
<pre><code></code></pre><ul>
<li>특정 변수에 데이터의 주소값을 선언</li>
<li>excel 파일로 읽기 + 뒤에 sheet_name을 통해 시트별로 불러 올 수 있다.</li>
<li>행과열을 Transepose 시켜주기</li>
<li>Dataframe의 요약정보 보여주기</li>
<li>Dataframe csv 파일로 변환 (python export csv) 이후 똑같이 읽어주면 된다.<pre><code></code></pre></li>
</ul>
<h4 id="2-첫번째-row를-행의-이름으로-설정하기">2. 첫번째 row를 행의 이름으로 설정하기</h4>
<blockquote>
<pre><code>https://stackoverflow.com/questions/31328861/python-pandas-replacing-header-with-top-row</code></pre></blockquote>
<pre><code></code></pre><ul>
<li><p>과제에서는 column의 모든 이름을 수작업으로 바꿔 주었다.</p>
</li>
<li><p>위의 stackoverflow에서 편한 방법 확인 가능하다.</p>
<pre><code>####  3. 데이터 dimension 확인하기

&gt;```
print(df1.size) 
print(df1.shape) 
print(df1.ndim)</code></pre></li>
</ul>
<pre><code>-  행 * 열 계산한 모든 갯수
-  행, 열 각각의 갯수를 파악할 수 있다
-  dataframe의 차원 알려준다 1차원 or 2차원</code></pre><h4 id="4-데이터의-결측치-확인하고-0으로-대체-or-해당-행열-제거">4. 데이터의 결측치 확인하고, 0으로 대체 or 해당 행,열 제거</h4>
<blockquote>
<pre><code>df1.isnull()
df1=df1.fillna(0)
pp.dropna()
df.isnull().sum() # 컬럼별 결측값 총합계</code></pre></blockquote>
<pre><code></code></pre><ul>
<li><p>결측이면 True  , 결측이 아니면 False
(참고) df1.isnull().sum() ==&gt; 칼럼별 결측값 갯수</p>
</li>
<li><p>결측치 값 0으로 대체</p>
</li>
<li><p>결측치가 존재하는 행 제거하기
```</p>
<h4 id="5-graphic-eda--특정-column값을-barplot으로-나타내기">5. graphic EDA : 특정 column값을 barplot으로 나타내기</h4>
</li>
<li><p>bar로 나타내기</p>
<blockquote>
<p>df2[&#39;FCF&#39;].plot.bar()</p>
</blockquote>
</li>
<li><p>그래프 그릴 때 오류나면 봐줘야 하는 설정들.</p>
<blockquote>
</blockquote>
<p>import matplotlib.pyplot as plt
import warnings
import matplotlib as mpl
import seaborn as sns
import numpy as np
import warnings
warnings.filterwarnings(&quot;ignore&quot;)
%matplotlib inline
%config InlineBackend.figure_format=&#39;retina&#39;
mpl.rc(&quot;font&quot;, family=&#39;Malgun Gothic&#39;)
mpl.rc(&#39;axes&#39;, unicode_minus=False)</p>
</li>
</ul>
<h4 id="6-graphic-eda--qq-plot-그리기--데이터의-분포-확인하기">6. graphic EDA : qq plot 그리기 = 데이터의 분포 확인하기</h4>
<blockquote>
</blockquote>
<p> import scipy.stats as stats
 import pylab
 stats.probplot(pp.bill_length_mm, dist=&quot;norm&quot;, plot=pylab)
 pylab.show()</p>
<blockquote>
</blockquote>
<h4 id="특정-column을-기준으로-나머지-column에-대해-plot그린다"><strong>특정 Column을 기준으로 나머지 Column에 대해 Plot그린다</strong></h4>
<h4 id="7-graphic-eda--box-plot-그리기">7. graphic EDA : box plot 그리기</h4>
<blockquote>
</blockquote>
<p> pp.boxplot(column=[&#39;bill_length_mm&#39;,&#39;bill_depth_mm&#39;,&#39;flipper_length_mm&#39;,&#39;body_mass_g&#39;,])</p>
<blockquote>
</blockquote>
<h4 id="8-summary-statistics-cross-tabulation">8 summary statistics, cross-tabulation</h4>
<blockquote>
<h4 id="summary-statistics">summary statistics</h4>
<p> pp[pp.columns[i]].mean()
 pp[pp.columns[i]].std()
 pp[pp.columns[i]].quantile(q=0.5) 
 (0 &lt;= q &lt;= 1 에서 Q의 값에 따라 백분위수가 바뀐다. 25, 50, 75, 100 따라서 현재는 3Q)</p>
</blockquote>
<hr>
<h4 id="cross-tabulation">cross-tabulation</h4>
<p> pd.crosstab(index=[pp.species], columns= pp.sex)</p>
<pre><code>예를들어 펭귄의 종족에 따른 성별 수를 알아보기 위해 사용할 수 있다.




## [github에서 해당 명령어 사용방법 확인하기](https://github.com/jangsik-park/ds-section1-sprint1/blob/master/n111-eda/n111a_eda.ipynb)</code></pre>]]></description>
        </item>
        <item>
            <title><![CDATA[공공데이터인턴(4)]]></title>
            <link>https://velog.io/@jangsik-park/20.12.02-%ED%9A%8C%EC%9D%98-%EC%A0%95%EB%A6%AC</link>
            <guid>https://velog.io/@jangsik-park/20.12.02-%ED%9A%8C%EC%9D%98-%EC%A0%95%EB%A6%AC</guid>
            <pubDate>Wed, 02 Dec 2020 08:34:40 GMT</pubDate>
            <description><![CDATA[<h1 id="201202-회의-내용-및-배운점">(20.12.02) 회의 내용 및 배운점</h1>
<hr>
<h3 id="중소기업은행-데이터-시각화-내용-발표">중소기업은행 데이터 시각화 내용 발표</h3>
<p>공공데이터 포털에 중소기업은행이 개방한 데이터 중 몇개를 선별하여 시각화를 진행하였다.
이번에는 발표 자료에 많은 공을 들인만큼 자신이 있었다고 생각했으나, 실제 발표때는 왜 이렇게 쳐지는 목소리만 나오는지... 이건 진짜 고치고 싶다. 조금 더 당차고!! 자신감 있게!!!</p>
<p>오늘 발표 내용을 토대로 피드백을 받았는데, 워드클라우드 부분과 각 시각화 과정 후에 시사점을 도출한 것에 대해 칭찬을 받아서 기분이 너무 좋았다!!! 작지만 뭐라도 인정받았다는 이 느낌... 너무 좋았다.</p>
<p>그리고 이건 매번 느끼는거지만 직원분들이 말을 진짜 잘하신다...
또 타인의 얘기를 주의깊게 듣고, 거기서 핵심을 잘 파악하시는 것 같다. 나같은 경우에 다른 팀원들이 얘기하는 것을 집중해서 듣기는 하지만, 중간에 저게 무슨 말이지? 했던 경우가 잦았던 것 같은데, 아무래도 IBK인이 되려면 조금 더 노력이 필요할 것 같다. 면접에서 이러한 모습이 비춰지지 않을까?</p>
<p><em>발표중에 나는 두가지 질문을 하였다.</em></p>
<blockquote>
<ul>
<li>왜 중동과 남미에 기업은행의 지점이 많이 없는가?</li>
</ul>
</blockquote>
<ul>
<li>중국과 인도네시아에는 왜 지점이 많은가?</li>
</ul>
<p><em>그에 대해 과장님께서 상세하게 답변을 해 주셨다.</em></p>
<blockquote>
<ul>
<li>중동 같은 경우는 규제가 너무 심하기 때문이다. 실제로 농협은 몇년전 <strong>수조원</strong>의 벌금을 물기도 했다는...
남미 같은 경우는 사실 금융서비스가 많이 필요한 곳이 아니다.
개발 도상국이고 발전가능성이 높은 것은 맞지만 <strong>아직 투자대비 수익성이 낮다!</strong> <br>
</li>
</ul>
</blockquote>
<ul>
<li>옛날부터 미래의 경제는 중국과 인도를 중심으로 돌아 갈 것이라는 전문가들의 예측이 많다.
그만큼 투자할 가치가 높기 때문에 현재 많은 지점이 투입되어 있는 것이다.</li>
</ul>
<p>면접을 가게 된다면, 이쪽으로 질문이 들어오도록 유도하거나 내가 먼저 선수쳐서 답변한다면 좋지 않을까? 라는 생각을 한다.
<br>
<em>팀원들의 발표내용에 대한 피드백 중에서도 양질의 Tip 들이 많았다</em></p>
<blockquote>
<ul>
<li>시각화를 할 때는 눈에 확 들어오게 하라!
ex) 범주가 많다면, 상위 몇개만 남기던지 하는 방식으로!<br>
</li>
</ul>
</blockquote>
<ul>
<li><p>별도의 웹사이트를 하나 더 구축하는 것은 비용측면에서 많은 부담이 된다. 따라서 한국은행처럼 공공데이터를 개방하는 형식은 무리일 것 같다.</p>
<blockquote>
</blockquote>
<p><em>대신에 현재 OPEN API Platform을 구축하고 있는데 그곳에서 많은 데이터들의 수입과, 개방이 이루어 질 것이다.</em></p>
<br>
- '**Big value(?)**와 왜 협업을 하지 않는가?' 에 대한 질문에 대해서
>
_IBK기업은행은 **탱커펀드(?)** 와의 협업을 통해 주택담보 대출시 자동심사가 이루어지도록 하였다. 대신에 다세대 주택 같은 경우에는 **은행 내부에 훌륭한 심사 자원들이 많아**서 굳이 타행처럼 협업을 하지 않아도 된다._
>
라고 답을 해 주셨는데, 중소기업은행을 향해 한걸음 더 나아간 것 같아 뿌듯했다.
<br>
- 다세대주택은 감정평가원에서의 평가가 불가능하다. 따라서 자체적으로 평가하는 방법을 사용한다.
<br>
- 은행에서 주택담보대출을 해 주는 Process
>
_1시간이 넘게 걸리는 주택 감정평가 -> 심사 결과 수령 -> 대출 실시_
>
**이건 사실 조금 더 구체적으로 정보를 찾아서 채워 넣을 필요가 있을 것 같다.**
<br>
- 국내 점포 위치 시각화를 보면, 공장 밀집 지역에 지점이 많이 위치해 있다.
**이것이 IBK 중소기업은행의 가장 큰 특징 중 하나!**
<br>_미래 오프라인 점포가 줄면서 대부분 은행의 지점 분포도가 이와 같은 특징을 갖게 될 것이다._

<p>짧은 시간이라고 생각했는데, 내용을 정리 해 보니까 정말 많은 것을 들었다...
일타강사의 쪽집게 과외가 이런 것인가...?</p>
<br>

</li>
</ul>
<h1 id="하루-다짐">하루 다짐</h1>
<hr>
<h3 id="이제-이곳에서의-생활이-3주정도의-시간-밖에-남지-않았다br조금-더-적극적으로-물어보고-배울걸-하는-아쉬움이-남는다">이제 이곳에서의 생활이 3주정도의 시간 밖에 남지 않았다.<br>조금 더 적극적으로 물어보고 배울걸 하는 아쉬움이 남는다.</h3>
<p> <em>사실 오늘 생각했던 질문을 하지 못 했기에 더 아쉬운 것 같다</em></p>
<h3 id="남은-시간만큼이라도-더-밝고-긍정적인-에너지를-뿜으며-업무에-임해서-더-많은-것을-얻어가야겠다">남은 시간만큼이라도 더 밝고, 긍정적인 에너지를 뿜으며 업무에 임해서, 더 많은 것을 얻어가야겠다!!!</h3>
]]></description>
        </item>
        <item>
            <title><![CDATA[I-one Bank]]></title>
            <link>https://velog.io/@jangsik-park/I-one-Bank</link>
            <guid>https://velog.io/@jangsik-park/I-one-Bank</guid>
            <pubDate>Fri, 27 Nov 2020 07:52:05 GMT</pubDate>
            <description><![CDATA[<h1 id="a-기능">A. 기능</h1>
<blockquote>
<h3 id="서비스명--원할때-환전">서비스명 : &#39;원할때 환전&#39;</h3>
</blockquote>
<ul>
<li>메뉴 - 외환 - 외화환전 - ONE할 때 환전</li>
<li>환율 수수료 우대 90 % (공통 환율 스트레드 = 1.75%)</li>
<li>최대 10,000달러 = 약 천만원 보관 가능</li>
<li>소금액 환테크 가능하다.</li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[마크다운 공부]]></title>
            <link>https://velog.io/@jangsik-park/%EB%A7%88%ED%81%AC%EB%8B%A4%EC%9A%B4-%EA%B3%B5%EB%B6%80</link>
            <guid>https://velog.io/@jangsik-park/%EB%A7%88%ED%81%AC%EB%8B%A4%EC%9A%B4-%EA%B3%B5%EB%B6%80</guid>
            <pubDate>Thu, 26 Nov 2020 06:07:47 GMT</pubDate>
            <description><![CDATA[<blockquote>
<ul>
<li><h3 id="github-markdown-자료"><a href="https://gist.github.com/ihoneymon/652be052a0727ad59601#241-%EB%93%A4%EC%97%AC%EC%93%B0%EA%B8%B0">github Markdown 자료</a></h3>
<br>
</li>
</ul>
</blockquote>
<ul>
<li><h1 id="참고자료는-맨-밑에-use-">참고자료는 맨 밑에!! (use ===)</h1>
<br>
- **Notion을 이용하면 Markdown 언어로 작성된 문서**가 Atom, Visual Studio Code, 
Notepad++ 복붙 하면 그대로 기입된다. 
<br> 그 다음에 웹 에디터에 붙여넣기 하면 **거의 완벽한 형태**로 복사된다. 
따라서 애용하면 좋다. 


</li>
</ul>
<h1 id="this-is-an-h1">this is an h1</h1>
<h2 id="this-is-an-h2">this is an h2</h2>
<h1 id="this-is-a-h1">this is a h1</h1>
<h2 id="this-is-a-h2">this is a h2</h2>
<h3 id="this-is-a-h3">this is a h3</h3>
<h4 id="this-is-a-h4">this is a h4</h4>
<h5 id="this-is-a-h5">this is a h5</h5>
<h6 id="this-is-a-h6">this is a h6</h6>
<blockquote>
<p>this is a first blockqute</p>
<blockquote>
<p>this is a second blosckqute
this is a third blockqute</p>
</blockquote>
</blockquote>
<h3 id="this-is-a-h3-1">this is a h3</h3>
<ul>
<li>list<blockquote>
<p>code</p>
</blockquote>
</li>
</ul>
<ol>
<li>첫번째</li>
<li>두번째</li>
<li>세번째</li>
</ol>
<ul>
<li><p>빨강</p>
<ul>
<li>녹색<ul>
<li>파랑</li>
</ul>
</li>
</ul>
</li>
<li><p>빨강</p>
<ul>
<li>녹색<ul>
<li>파랑</li>
</ul>
</li>
</ul>
</li>
<li><p>파랑</p>
<ul>
<li>빨강<ul>
<li>초록<ul>
<li>노랑<ul>
<li>녹색
this is a normal paragraph:
this is a code block
first tkdan hhgjd tncnfdlqdmsgodprkk  many pr
end tkdnan 2tkdjq chddhkf tkdansaldl ehltlwy qhsqnwkdsla tkdansla qkrdlsrb tkdan</li>
</ul>
</li>
</ul>
</li>
</ul>
</li>
</ul>
</li>
</ul>
<p>This is a normal paragraph:</p>
<pre><code>This is a code block.</code></pre><p>end code block.</p>
<p>this is a normal paragraph:</p>
<pre><code>this is a code block.
dffdfasfsdfasdf</code></pre><p>this is a modern if and i like it so i dont want to drink water. so that  can</p>
<pre><code>코드를 입력하세요</code></pre><pre>
<code>
 public class boootstrapvootpaPPlication {
     public static void main(String[] args) {
        System.out,jprintln("Hello, Honeymoon")

</code>
</pre>

<pre><code>코드입력

public class bootstrapboootapplication {
    public static void main(String[] args) {</code></pre><hr>
<hr>
<hr>
<hr>
<hr>
<hr>
<p><a href="https://google.com," title="google link">google</a></p>
<p><a href="http://example.com/">http://example.com/</a></p>
<p><em>single asterisks</em></p>
<p><del>cancel line</del></p>
<p><del>취소는 이렇게</del>
*<em>볼드체는 이렇게 쓰는겁니다 *</em></p>
<p><em>이거는 무슨용도일까</em>
<em>기울여 쓰기</em></p>
<blockquote>
<p><strong>볼드체</strong>
<em>기울임</em>
<del>취소</del>
<em>기울임</em>
<em>기울임</em></p>
</blockquote>
<p><img src="https://images.velog.io/images/jangsik-park/post/bc835a5e-8598-4f2d-a887-beefcad63900/img.jpg" alt=""></p>
<ul>
<li><p><input checked="" disabled="" type="checkbox">  @mentions, #refs, <a href="">links</a>, <strong>formatting</strong>, and <del>tags</del> supported</p>
</li>
<li><p><input checked="" disabled="" type="checkbox">  list syntax required (any unordered or ordered list supported)</p>
</li>
<li><p><input checked="" disabled="" type="checkbox">  this is a complete item</p>
</li>
<li><p><input disabled="" type="checkbox">  this is an incomplete item</p>
</li>
<li><p><input checked="" disabled="" type="checkbox">  a</p>
</li>
<li><p><input disabled="" type="checkbox">  b</p>
</li>
<li><p><input disabled="" type="checkbox">  c</p>
</li>
</ul>
<br>

<blockquote>
<p>표 생성</p>
</blockquote>
<table>
<thead>
<tr>
<th align="center">column1</th>
<th align="center">column2</th>
<th align="center">column3</th>
</tr>
</thead>
<tbody><tr>
<td align="center">내용1</td>
<td align="center">내용1</td>
<td align="center">내용1</td>
</tr>
</tbody></table>
<p> 가운데 정렬 |:---:|
 왼족정렬 |:---|
오른쪽 정렬|---:|</p>
<br>

<h1 id="-참고자료-">!!! 참고자료 !!!</h1>
<ul>
<li><h4 id="깃허브-취향의-마크다운-번역"><a href="https://nolboo.kim/blog/2014/03/25/github-flavored-markdown/">깃허브 취향의 마크다운 번역</a></h4>
</li>
<li><h4 id="github-마크다운-자료"><a href="https://gist.github.com/ihoneymon/652be052a0727ad59601#241-%EB%93%A4%EC%97%AC%EC%93%B0%EA%B8%B0">Github 마크다운 자료</a></h4>
</li>
<li><h4 id="표생성"><a href="https://lynmp.com/ko/article/title/markdown-table-om811c9dc5oi">표생성</a></h4>
</li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[진로 관련 정리]]></title>
            <link>https://velog.io/@jangsik-park/%EC%A7%84%EB%A1%9C-%EA%B4%80%EB%A0%A8-%EC%A0%95%EB%A6%AC</link>
            <guid>https://velog.io/@jangsik-park/%EC%A7%84%EB%A1%9C-%EA%B4%80%EB%A0%A8-%EC%A0%95%EB%A6%AC</guid>
            <pubDate>Fri, 20 Nov 2020 08:37:08 GMT</pubDate>
            <description><![CDATA[<h4 id="하고-싶은-것">하고 싶은 것</h4>
<ul>
<li><p>금융권 디지털 부서에 취업하여 IT서비스 기획</p>
<p>Why? 왜 금융권이냐고? 돈 많이 준다. 돈에 대해서 배울 수 있을 것 같다.
Real? 약간의 인턴 경험이었지만, 돈은 내 기준에서 많이 주는거 확실하다고 생각한다.</p>
</li>
</ul>
<ul>
<li>IT서비스 기획 + 데이터엔지니어</li>
</ul>
<hr>
<ul>
<li>AR, VR을 이용한 디지털 트윈 구축</li>
</ul>
<hr>
<h4 id="배워야-하는-것">배워야 하는 것</h4>
<ul>
<li><p>JAVA
데이터 엔지니어를 하기 위해서는 우선 백앤드 개발부터 시작해야 한다.
동시에 ios앱을 만들어 보면 좋다고 생각한다.</p>
<p><a href="https://www.inflearn.com/roadmaps/25">우아한형제들 인프런</a></p>
<br>

<ul>
<li><p>AR, VR 
아래와 같은 방법을 통해 배울 수 있다.</p>
<p><a href="https://ar.kaist.ac.kr/">카이스트 대학원</a>
<a href="http://maxst.com/#/ko/arsdk">MAXST</a></p>
</li>
</ul>
</li>
</ul>
<h4 id="plan-b">Plan B</h4>
<p>공기업 물론 가기 힘든 것 맞지만, 당장 하고 싶은걸 미룰만큼 메리트가 있다고 생각하지는 않는다. 1~2년 공부해보고 아니다 싶으면 공기업 전산직 OR 기술보증기금 같은 곳을 가고 싶다. 우선은 당장 배워야 하는 것에 최대한 집중 할 것이다.</p>
<ul>
<li>기술보증기금 (공기업)</li>
<li>인천국제공항공사(공기업)</li>
</ul>
<h4 id="plac-c">Plac C</h4>
<p>유학을 가고 싶다. 석사 과정을 영국에서 밟으면 적응시간 6개월 + 석사과정 1년 총 1.5년이 소요될 것으로 예상된다. 대략 <strong>8천만원</strong> 정도가 필요할 것 같다.</p>
]]></description>
        </item>
        <item>
            <title><![CDATA[IT 교육 사이트 정리]]></title>
            <link>https://velog.io/@jangsik-park/IT-%EA%B5%90%EC%9C%A1-%EC%82%AC%EC%9D%B4%ED%8A%B8-%EC%A0%95%EB%A6%AC</link>
            <guid>https://velog.io/@jangsik-park/IT-%EA%B5%90%EC%9C%A1-%EC%82%AC%EC%9D%B4%ED%8A%B8-%EC%A0%95%EB%A6%AC</guid>
            <pubDate>Mon, 16 Nov 2020 08:16:22 GMT</pubDate>
            <description><![CDATA[<p><a href="http://edu2.kosta.or.kr/notice/post?id=2275">코스타에듀</a></p>
<p><a href="https://boostcamp.connect.or.kr/guide.html">부트캠프</a></p>
<p><a href="https://42seoul.kr/">42서울</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[kakao 코딩테스트 후기]]></title>
            <link>https://velog.io/@jangsik-park/kakao-%EC%BD%94%EB%94%A9%ED%85%8C%EC%8A%A4%ED%8A%B8-%ED%9B%84%EA%B8%B0</link>
            <guid>https://velog.io/@jangsik-park/kakao-%EC%BD%94%EB%94%A9%ED%85%8C%EC%8A%A4%ED%8A%B8-%ED%9B%84%EA%B8%B0</guid>
            <pubDate>Sat, 14 Nov 2020 03:58:28 GMT</pubDate>
            <description><![CDATA[<p>카카오 추천팀 2020 겨울 인턴쉽을 위하여 코딩테스트를 응시하였다.</p>
<p>한문제 풀었다.</p>
<blockquote>
<p>1차 문제</p>
</blockquote>
]]></description>
        </item>
        <item>
            <title><![CDATA[아이디어 노트]]></title>
            <link>https://velog.io/@jangsik-park/%EC%95%84%EC%9D%B4%EB%94%94%EC%96%B4-%EB%85%B8%ED%8A%B8</link>
            <guid>https://velog.io/@jangsik-park/%EC%95%84%EC%9D%B4%EB%94%94%EC%96%B4-%EB%85%B8%ED%8A%B8</guid>
            <pubDate>Wed, 11 Nov 2020 08:14:07 GMT</pubDate>
            <description><![CDATA[<h3 id="금융">금융</h3>
<h4 id="1-각-금융사에서-개설한-자동이체-이자금-상환-등의-계좌-조회-후-옮길-수-있게-하기">1. 각 금융사에서 개설한 자동이체, 이자금 상환 등의 계좌 조회 후 옮길 수 있게 하기.</h4>
<ul>
<li>각 금융사 별로 다른 이자율, 혜택을 제공하여 보여주고, 소비자가 선택할 수 있게 한다.</li>
</ul>
<blockquote>
<p>금융권 서비스 핵심</p>
</blockquote>
<ol>
<li>디지털 금융시대에 다양한 비즈니스 뱅킹 모델들이 등장한다. 
이때 <strong>디지털카테고리 킬러 모델</strong>을 만드는 것이 각 금융사의 핵심 사업이다.</li>
</ol>
<p><strong>Q.</strong> 디지털 카테고리 킬러모델?
<strong>A.</strong> 특정 금융서비스 분야에서 시장 지배력을 높여야 한다. 
ex) IBK기업은행은 중소기업 대출에 <strong>특화된</strong> 서비스를 발전시켜~~</p>
<h3 id="패션">패션</h3>
<h4 id="1-옷에-장치를-달아서-현관문을-나갈때-마다-입은-횟수-계산한다">1. 옷에 장치를 달아서, 현관문을 나갈때 마다 입은 횟수 계산한다.</h4>
<ul>
<li>이를 통해 중고시장에서 더 큰 신뢰를 쌓을 수 있다.<h4 id="2-옷에-부착된-상품정보를-디지털화하여-저장한다">2. 옷에 부착된 상품정보를 디지털화하여 저장한다.</h4>
</li>
<li>세탁이나 관리 방법을 추천 받을 수 있다.</li>
<li>지금 오늘의 코디에서는 제품을 사진으로 찍은 다음에 디지털화하여 저장한다. 이를 활용하여 코디를 하는데, 사용자 입장에서 큰 메리트를 못 느낄 것 같다.
따라서 상품정보를 디지털화한다면 어떤 브랜드의 어떤 제품인지 알 수 있으므로 조금 더 <strong>코디를 추천</strong>하는 것이 수월하지 않을까 생각한다.</li>
</ul>
]]></description>
        </item>
    </channel>
</rss>