<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>data_shirouto.log</title>
        <link>https://velog.io/</link>
        <description>매일 조금씩:)</description>
        <lastBuildDate>Sun, 06 Mar 2022 08:55:51 GMT</lastBuildDate>
        <docs>https://validator.w3.org/feed/docs/rss2.html</docs>
        <generator>https://github.com/jpmonette/feed</generator>
        <image>
            <title>data_shirouto.log</title>
            <url>https://images.velog.io/images/data_shirouto/profile/2c046cbb-3294-4235-bb18-fd0d2bfc49b9/KakaoTalk_20220101_203304494.jpg</url>
            <link>https://velog.io/</link>
        </image>
        <copyright>Copyright (C) 2019. data_shirouto.log. All rights reserved.</copyright>
        <atom:link href="https://v2.velog.io/rss/data_shirouto" rel="self" type="application/rss+xml"/>
        <item>
            <title><![CDATA[헤이조이스<성공하는 PM의 7가지 법칙 Day 2> 토스 PO 안지영님]]></title>
            <link>https://velog.io/@data_shirouto/%ED%97%A4%EC%9D%B4%EC%A1%B0%EC%9D%B4%EC%8A%A4%EC%84%B1%EA%B3%B5%ED%95%98%EB%8A%94-PM%EC%9D%98-7%EA%B0%80%EC%A7%80-%EB%B2%95%EC%B9%99-Day-2-%ED%86%A0%EC%8A%A4-PO-%EC%95%88%EC%A7%80%EC%98%81%EB%8B%98</link>
            <guid>https://velog.io/@data_shirouto/%ED%97%A4%EC%9D%B4%EC%A1%B0%EC%9D%B4%EC%8A%A4%EC%84%B1%EA%B3%B5%ED%95%98%EB%8A%94-PM%EC%9D%98-7%EA%B0%80%EC%A7%80-%EB%B2%95%EC%B9%99-Day-2-%ED%86%A0%EC%8A%A4-PO-%EC%95%88%EC%A7%80%EC%98%81%EB%8B%98</guid>
            <pubDate>Sun, 06 Mar 2022 08:55:51 GMT</pubDate>
            <description><![CDATA[<blockquote>
<p>토스 PO가 말하는 프로덕트 성과를 극대화하는 방법</p>
</blockquote>
<p>PO : 제품의 성공을 최종으로 책임지는 사람</p>
<ol>
<li>제품 방향성이 막연할 때, 중심 잡는 법</li>
</ol>
<p>다음 스텝 → 나의 백로그, 이게 결국 전부다.
(예시 : PON 리스트, Problem/Opportunity/Needs)
KPI : 고객 경험 / 매출 / 성장
(내가 속한 회사 레벨의 상위 KPI)
Sub metric : NPS / 가입 전환율 / 친구 초대 수
(내가 속한 팀의 KPI, 데이터 모델링을 활용해본다)
소스 : 고객 / 팀 인사이트 / 데이터 분석
(아이디어의 원천, 회고에 유용, 다양한 채널)
PON : 구현된 기능의 제약으로 ~정보가 토스앱에서 너무 늦게 조회된다. 토스앱 홈탭에 진입점을 노출한다 / 11월에 개선한 친구초대 스킴으로 viral K가 ~수준으로 올라갔다. 
(내 제품의 문제와 기회, 요인)
Definition of Awesome : ~ API를 활용하여 실시간으로 ~정보를 확인할 수 있다 / ~으로 판단된 고객은 토스앱 메인에서 바로 서비스를 발견한다. / 유저 1명이 평균 ~명의 사용자를 자발적으로 데려온다.
(내 제품의 문제와 기회, 요인을 잘 풀어낸 솔루션)
Priority : 중간 / 낮음 / 높음
(우선 순위)</p>
<p>  *백로그 : 방향, 집중, 상황판 역할, 상시 업데이트</p>
<ol start="2">
<li>신규 개발할 때 중심 잡는 법
(MVP : Minimum Viable Product, 실행 가능한 최소 크기의 제품)
극 초반에 하기 쉬운 실수들(=하면 안되는 실수들)
: 있으면 좋으니까 개발한다 / 런칭하자마자 대규모 푸시 보내기 / 예측에 기반해 스펙 추가하기 / 런칭하고 자랑하고 축하하기</li>
</ol>
<p>MVP : 개발 공수 크기가 아니라 &#39;최소 가치&#39;, 가설이 옳았느느지 검증하기 위해 제공될 가장 작은 가치</p>
<p>▶ <del>PO의 멘탈리티</del> : 인정받고 싶은 에고 버리기 / 아무도 안 쓸것이라고 기대하기 / 6개월 뒤 없어질 수 있는 제품이라는 생각으로 만들기 / 런칭은 단지 시작일 뿐, 그 자체로 축하할 일이 아니다.</p>
<p>핵심 가치를 검증하는 데 필요하지 않다면 과감히 빼기
소규모 오픈, 고객의 목소리 수집하기
<strong>코드 짜기 전에 고객에게 물어보기 **
(예: 주요 화면마다 &#39;문의&#39; 버튼 추가)
**PM fit을 찾았을 때 축하하기</strong>
 survey, 
 NPS:추천 지수(Net Promoter Score)
 → 추천 고객의 % - 비추천 고객의 %(토스의 경우 80점 이상이면 great)
 Retention Curve : 리텐션이 잘 나온다면 우리 제품을 잘 쓰는 대부분의 사용자가 하는 특정 행위들을 파악함</p>
<p>각 제품의 스테이지마다 맞는 방법들에 대한 고민</p>
<ol start="3">
<li>멘탈 중심잡기
PO의 멘탈은 제품의 성공을 좌지우지 하는 요소로서 관리되어야 한다.
추천 책 : 팀장의 탄생</li>
</ol>
<p>*내가 모르면 남들도 모르더라
*내가 어려우면 남들도 어려워하더라
*내가 나를 못믿는데 고객을 어떻게 설득시킬 것인가
*나는 나여서 내 방식으로 할 때, 나다울 때 가장 성공할 수 있다</p>
<p><strong>중요한 심리 자본으로서의 &#39;자신감&#39;</strong></p>
<p>해결사 병에서 벗어나서 도움을 요청하자
<strong>동료의 시간을 오직 나라는 존재의 학습을 위해서만 사용하는 것은 큰 용기가 필요한 일이며, 그런 용기가 있는 사람만이 성장할 수 있다.</strong></p>
<p>토스 PO Skill set
-Experience
-Mobile gut feeling
-Analytic Mindset
-Business development
-Growth hacker mindset
-Grit/Obsession
-People management</p>
<p>여기서 나의 장점은 몇 가지인가? 어떤 것인가? </p>
<p>*toss tuba(내부 툴)
 <del>이건 진짜 너무 궁금하다...!!!!!!!!!</del></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[헤이조이스<성공하는 PM의 7가지 법칙 Day 2>구글 Product Manager 이해민님]]></title>
            <link>https://velog.io/@data_shirouto/%ED%97%A4%EC%9D%B4%EC%A1%B0%EC%9D%B4%EC%8A%A4%EC%84%B1%EA%B3%B5%ED%95%98%EB%8A%94-PM%EC%9D%98-7%EA%B0%80%EC%A7%80-%EB%B2%95%EC%B9%99-Day-2%EA%B5%AC%EA%B8%80-Product-Manager-%EC%9D%B4%ED%95%B4%EB%AF%BC%EB%8B%98</link>
            <guid>https://velog.io/@data_shirouto/%ED%97%A4%EC%9D%B4%EC%A1%B0%EC%9D%B4%EC%8A%A4%EC%84%B1%EA%B3%B5%ED%95%98%EB%8A%94-PM%EC%9D%98-7%EA%B0%80%EC%A7%80-%EB%B2%95%EC%B9%99-Day-2%EA%B5%AC%EA%B8%80-Product-Manager-%EC%9D%B4%ED%95%B4%EB%AF%BC%EB%8B%98</guid>
            <pubDate>Sun, 06 Mar 2022 07:31:54 GMT</pubDate>
            <description><![CDATA[<blockquote>
<p>15년차 구글 PM이 말하는 실리콘밸리 PM의 의사결정법</p>
</blockquote>
<p>-Product Manager는 무엇을 하는 사람인가요?
 제품에 대한 최종 책임을 지는 사람
 &#39;너의 제품은 네가 책임져라&#39;</p>
<p>-여러가지 일 중 가장 중요한 일?
 <strong>Decision</strong></p>
<p>-데이터에 기반한 결정내리기
 현재 우리 제품의 상황과 개선점에 대한 공통 이해가 있나?
 맞는 지표가 정의 되어 있나?
 결정 권한이 잘 분배되어 있나?
 우리는 서로를 믿나?</p>
<p>-나의 제품/서비스가 무엇을 하려는 단계인지 이해하자</p>
<p> 1) 현재 내 제품, 서비스는 어떤 과제를 수행해야 할까요?
 → 리스트업 하기 
 2) 나의 업무 환경이 어떠한지 돌아보자
    #가용할 리소스들 체크
     인력 리소스
     도구 리소스
     리뷰 리소스
    #분위기
     예) <em>좋은 아이디어는 널리널리 공유하자
         빨리 실험해보고 다음으로 가자
         느린 완벽한 결정보다 빠른 덜 완벽한 결정이 낫다
         사용자가 우선이다</em></p>
<p><strong>도구 : 양적/질적 데이터 둘 다 필요하다</strong>
 → 개개인이 (라이브)실험을 할 수 있는 환경,
    라이브 트래픽에 실험군을 넣을 수 있는 방법,
    타겟 실험군을 선택할 수 있는 방법,
    실험군과 대조군의 각 지표를 보여줄 수 있는 대시보드
    (Google Optimize, 오픈 서베이)</p>
<p><strong>사람 : 사람이 맞게 배치되어 있어야 한다</strong>
&quot;사람이 제일 중요합니다. 필요한 사람들이 모두 머리를 맞댑니다.&quot;
→ 중요한 건 나 혼자 생각해서 나 혼자 본다기보다는 이 일의 목적에 과련된 모든 사람들이 &#39;토론&#39;하여 실험을 다듬어 내놓는 것.
→ 여럿이 머리를 모으기 때문에 &#39;훌륭함&#39;에 더 다가가고 불필요한 보고 커뮤니케이션을 줄이게 되면 효과적인 만들기가 가능해짐.
→ 분석된 데이터를 보고 어떤 방향으로 끌고갈지 결정하는 주체도 사람
하지만, 어떤 때에는 감을 믿고 프로덕트 인사이트를 통해 의사결정을 내려야 하기도 한다. 왜냐하면, 데이터라는 것은 &#39;과거&#39;이기 때문에.</p>
<p><strong>무형의 중요한 것들 ; 나는 왜 실험을 돌리는가</strong>
→ 문제와 가설, 그리고 메트릭
→ 나는 어떤 문제를 풀고 싶고 그 문제를 풀기 위해 어떠한 가설을 세웠는가.
→ 가설들과 매칭되는 메트릭들(아주 드물게 메트릭으로 해석되는 문제가 아닌 경우도 있다)
→ 계속해서 문제를 해결해가는 것</p>
<p>Product Manager가 되려면 무엇을 해야 할까요?
지금 하는 일에 대해 리더쉽을 가질 것.
(리더쉽 ; 내가 가지고 있는 책임과 권한을 극대화하는 것)
새로운 조직에 던져졌다면 프로덕트의 비전, 성공 기준(success metric), 사용자들에게 전달 할 수 있는 방법을 마련할 것.
팀워크.
<em>IT 관련 기업이라면 기술적/개발적인 배경을 가지는 것을 추천.</em>
긍정 화법에 익숙해질 것(셀프 세뇌)</p>
<p><strong>내가 사용자가 아닌 제품을 만드는 것은 정말 어렵다. &#39;내가 사용자&#39;여야 한다.</strong>
<strong>각 파트의 담당자가 정확한 액션을 취할 수 있도록 커뮤니케이션을 한다.</strong>
<strong>실패를 빨리 경험하는 것. 실패를 디딤돌처럼 다룰 수 있어야 한다.</strong>
<strong>리소스 낭비를 줄일 수 있도록 한다</strong></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[생산 관리 - 코로나 이슈에 따른 매출 임팩트]]></title>
            <link>https://velog.io/@data_shirouto/%EC%83%9D%EC%82%B0-%EA%B4%80%EB%A6%AC-%EC%BD%94%EB%A1%9C%EB%82%98-%EC%9D%B4%EC%8A%88%EC%97%90-%EB%94%B0%EB%A5%B8-%EB%A7%A4%EC%B6%9C-%EC%9E%84%ED%8C%A9%ED%8A%B8</link>
            <guid>https://velog.io/@data_shirouto/%EC%83%9D%EC%82%B0-%EA%B4%80%EB%A6%AC-%EC%BD%94%EB%A1%9C%EB%82%98-%EC%9D%B4%EC%8A%88%EC%97%90-%EB%94%B0%EB%A5%B8-%EB%A7%A4%EC%B6%9C-%EC%9E%84%ED%8C%A9%ED%8A%B8</guid>
            <pubDate>Tue, 01 Feb 2022 13:06:43 GMT</pubDate>
            <description><![CDATA[<p>패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 08.의 내용을 정리 했습니다.</p>
<ul>
<li><p>모수의 차이로 인해 그래프상에서 제대로 된 변화를 보여줄 수 없는 경우, 
하나의 항목에 하나의 그래프가 노출되도록 한다. </p>
</li>
<li><p>데이터 시각화에 있어, &#39;보기 좋음&#39;의 기준은 데이터와 그래프를 보는 상대방이다.</p>
</li>
</ul>
<p><img src="https://images.velog.io/images/data_shirouto/post/02955177-28da-47fa-a59f-1c9524ac7a00/220201_07.PNG" alt=""></p>
<ul>
<li>증감의 정도를 보여주는 방법 : 일반 숫자, 퍼센테이지 중 취사 선택에 대해 고민해보기</li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[생산 관리 - 계절별 주력 상품 판매 전략 수립]]></title>
            <link>https://velog.io/@data_shirouto/%EC%83%9D%EC%82%B0-%EA%B4%80%EB%A6%AC-%EA%B3%84%EC%A0%88%EB%B3%84-%EC%A3%BC%EB%A0%A5-%EC%83%81%ED%92%88-%ED%8C%90%EB%A7%A4-%EC%A0%84%EB%9E%B5-%EC%88%98%EB%A6%BD</link>
            <guid>https://velog.io/@data_shirouto/%EC%83%9D%EC%82%B0-%EA%B4%80%EB%A6%AC-%EA%B3%84%EC%A0%88%EB%B3%84-%EC%A3%BC%EB%A0%A5-%EC%83%81%ED%92%88-%ED%8C%90%EB%A7%A4-%EC%A0%84%EB%9E%B5-%EC%88%98%EB%A6%BD</guid>
            <pubDate>Tue, 01 Feb 2022 12:28:49 GMT</pubDate>
            <description><![CDATA[<p>패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 08.의 내용을 정리 했습니다.</p>
<p>추세선 그려보는 습관 ; 궁극적으로 추세선으로 알 수 있는 것, 아닌 것을 구별하기</p>
<ul>
<li><p>추세, 추이, 트렌드 파악하기 </p>
</li>
<li><p>월별, 분기별로 데이터 시각화하는 연습</p>
</li>
</ul>
<p><img src="https://images.velog.io/images/data_shirouto/post/5175c425-e406-4fc6-8dcb-156b60610c1c/220201_06.PNG" alt=""></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[마케팅 - 네이버 검색량에 따른 콘텐츠 소비의 변화 ]]></title>
            <link>https://velog.io/@data_shirouto/%EB%A7%88%EC%BC%80%ED%8C%85-%EB%84%A4%EC%9D%B4%EB%B2%84-%EA%B2%80%EC%83%89%EB%9F%89%EC%97%90-%EB%94%B0%EB%A5%B8-%EC%BD%98%ED%85%90%EC%B8%A0-%EC%86%8C%EB%B9%84%EC%9D%98-%EB%B3%80%ED%99%94</link>
            <guid>https://velog.io/@data_shirouto/%EB%A7%88%EC%BC%80%ED%8C%85-%EB%84%A4%EC%9D%B4%EB%B2%84-%EA%B2%80%EC%83%89%EB%9F%89%EC%97%90-%EB%94%B0%EB%A5%B8-%EC%BD%98%ED%85%90%EC%B8%A0-%EC%86%8C%EB%B9%84%EC%9D%98-%EB%B3%80%ED%99%94</guid>
            <pubDate>Tue, 01 Feb 2022 12:00:14 GMT</pubDate>
            <description><![CDATA[<p>패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 08.의 내용을 정리 했습니다.</p>
<p><img src="https://images.velog.io/images/data_shirouto/post/8326781d-b5b4-4360-be92-cc7e428c77ab/220201_05.PNG" alt=""></p>
<ul>
<li>PC와 모바일 상의 클릭수, 검색수, 검색어가 어떤 차이를 보이는지 확인해 보기</li>
</ul>
<blockquote>
<p>경험적으로 &#39;검색어&#39;는 이용자의 직관과 니즈를 이해할 수 있는 굉장히 좋은 데이터이다. </p>
</blockquote>
<ul>
<li>시대상을 읽어볼 수 있는 뉴스 체크하기 </li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[마케팅 - SNS 광고 효율을 올리기 위한 광고 전략]]></title>
            <link>https://velog.io/@data_shirouto/%EB%A7%88%EC%BC%80%ED%8C%85-SNS-%EA%B4%91%EA%B3%A0-%ED%9A%A8%EC%9C%A8%EC%9D%84-%EC%98%AC%EB%A6%AC%EA%B8%B0-%EC%9C%84%ED%95%9C-%EA%B4%91%EA%B3%A0-%EC%A0%84%EB%9E%B5</link>
            <guid>https://velog.io/@data_shirouto/%EB%A7%88%EC%BC%80%ED%8C%85-SNS-%EA%B4%91%EA%B3%A0-%ED%9A%A8%EC%9C%A8%EC%9D%84-%EC%98%AC%EB%A6%AC%EA%B8%B0-%EC%9C%84%ED%95%9C-%EA%B4%91%EA%B3%A0-%EC%A0%84%EB%9E%B5</guid>
            <pubDate>Tue, 01 Feb 2022 11:10:41 GMT</pubDate>
            <description><![CDATA[<p>패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 08.의 내용을 정리 했습니다.</p>
<p><img src="https://images.velog.io/images/data_shirouto/post/0681cf29-e3a5-4eb6-880d-a5b9b0645b47/220201_03.PNG" alt=""></p>
<p>: 시즌, 시기에 맞는 이슈들 확인해보기</p>
<ul>
<li><p>노출수에 영향을 미치는 요인들은?</p>
</li>
<li><p>클릭 당 비용은 적을수록 좋다</p>
</li>
</ul>
<p><img src="https://images.velog.io/images/data_shirouto/post/8cf5d873-7927-4f75-9e30-4d09fc47993c/220201_04.PNG" alt=""></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[상품 서비스 기획 - 컬러와 가격이 결정하는 패션 아이템]]></title>
            <link>https://velog.io/@data_shirouto/%EC%83%81%ED%92%88-%EC%84%9C%EB%B9%84%EC%8A%A4-%EA%B8%B0%ED%9A%8D-%EC%BB%AC%EB%9F%AC%EC%99%80-%EA%B0%80%EA%B2%A9%EC%9D%B4-%EA%B2%B0%EC%A0%95%ED%95%98%EB%8A%94-%ED%8C%A8%EC%85%98-%EC%95%84%EC%9D%B4%ED%85%9C</link>
            <guid>https://velog.io/@data_shirouto/%EC%83%81%ED%92%88-%EC%84%9C%EB%B9%84%EC%8A%A4-%EA%B8%B0%ED%9A%8D-%EC%BB%AC%EB%9F%AC%EC%99%80-%EA%B0%80%EA%B2%A9%EC%9D%B4-%EA%B2%B0%EC%A0%95%ED%95%98%EB%8A%94-%ED%8C%A8%EC%85%98-%EC%95%84%EC%9D%B4%ED%85%9C</guid>
            <pubDate>Tue, 01 Feb 2022 10:53:43 GMT</pubDate>
            <description><![CDATA[<p>패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 08.의 내용을 정리 했습니다.</p>
<ul>
<li>꺽은 선, 막대 혼합 그래프 만들어보기</li>
</ul>
<p>*<em>★데이터 시각화 연습하기 *</em></p>
<p><img src="https://images.velog.io/images/data_shirouto/post/b7651e34-ef96-4fe6-9cbf-649ef4cdb3a7/220201_02.PNG" alt=""></p>
<ul>
<li>주요 검색어 리스트업 하기(검색 광고) : 판매 전략 데이터로 활용</li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[상품 서비스 기획-성공적인 이벤트를 돕는 배너 기획]]></title>
            <link>https://velog.io/@data_shirouto/%EC%83%81%ED%92%88-%EC%84%9C%EB%B9%84%EC%8A%A4-%EA%B8%B0%ED%9A%8D-%EC%84%B1%EA%B3%B5%EC%A0%81%EC%9D%B8-%EC%9D%B4%EB%B2%A4%ED%8A%B8%EB%A5%BC-%EB%8F%95%EB%8A%94-%EB%B0%B0%EB%84%88-%EA%B8%B0%ED%9A%8D</link>
            <guid>https://velog.io/@data_shirouto/%EC%83%81%ED%92%88-%EC%84%9C%EB%B9%84%EC%8A%A4-%EA%B8%B0%ED%9A%8D-%EC%84%B1%EA%B3%B5%EC%A0%81%EC%9D%B8-%EC%9D%B4%EB%B2%A4%ED%8A%B8%EB%A5%BC-%EB%8F%95%EB%8A%94-%EB%B0%B0%EB%84%88-%EA%B8%B0%ED%9A%8D</guid>
            <pubDate>Tue, 01 Feb 2022 10:40:48 GMT</pubDate>
            <description><![CDATA[<p>패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 08.의 내용을 정리 했습니다.</p>
<p>-배너를 언제, 누구에게 노출시킬지에 대하여 고민하기</p>
<p>-시간대별 트래킹 파악하기</p>
<p>▼예시
<img src="https://images.velog.io/images/data_shirouto/post/7d9efb71-cc2b-42f7-a63a-185b1f83a155/220201_01.PNG" alt=""></p>
<p><strong>-방문수 대비 이탈수, 회원가입수, 주문수 비교하기</strong>
(매체별로 확인하기)</p>
<p>-이벤트 혹은 광고 소재에 따른 &#39;효율성&#39; 재고도 같이 이루어져야 한다. 즉, 세부적인 것은 물론 총체적인 그림이 머리에서 같이 그려져야 한다.  </p>
]]></description>
        </item>
        <item>
            <title><![CDATA[여름에 판매하면 좋은 상품 ]]></title>
            <link>https://velog.io/@data_shirouto/%EC%97%AC%EB%A6%84%EC%97%90-%ED%8C%90%EB%A7%A4%ED%95%98%EB%A9%B4-%EC%A2%8B%EC%9D%80-%EC%83%81%ED%92%88</link>
            <guid>https://velog.io/@data_shirouto/%EC%97%AC%EB%A6%84%EC%97%90-%ED%8C%90%EB%A7%A4%ED%95%98%EB%A9%B4-%EC%A2%8B%EC%9D%80-%EC%83%81%ED%92%88</guid>
            <pubDate>Sun, 30 Jan 2022 13:59:57 GMT</pubDate>
            <description><![CDATA[<p>_패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 05.의 내용을 정리 했습니다.</p>
<p>**<em>분산분석 : 서로 다른 변수나 표본이 있을 때, 그것들을 비교하는 분석법
*</em></p>
<p>*품목별 매출 동향에 어떤 요인이 영향을 미치는가?</p>
<p>*각 품목들의 매대 위치는 동일하다. </p>
<p>*계절의 영향을 받는 품목이 있다. (연령대를 파악한다면 추세를 더 자세하게 이해할 수 있다.)</p>
<p><img src="https://images.velog.io/images/data_shirouto/post/a05732fb-43a1-4a2f-aef6-1f82029abec7/220130_17.PNG" alt=""></p>
<p>*고객 데이터를 상세하게 본 후, 각 품목의 하위 상품들이 어떻게 구성되어 있는지 파악해 볼 필요가 있다. </p>
<p>*시계열 데이터(월별, 계절별), 추세 파악하기(세부, 하위)</p>
]]></description>
        </item>
        <item>
            <title><![CDATA[클릭을 부르는 배너 위치]]></title>
            <link>https://velog.io/@data_shirouto/%ED%81%B4%EB%A6%AD%EC%9D%84-%EB%B6%80%EB%A5%B4%EB%8A%94-%EB%B0%B0%EB%84%88-%EC%9C%84%EC%B9%98</link>
            <guid>https://velog.io/@data_shirouto/%ED%81%B4%EB%A6%AD%EC%9D%84-%EB%B6%80%EB%A5%B4%EB%8A%94-%EB%B0%B0%EB%84%88-%EC%9C%84%EC%B9%98</guid>
            <pubDate>Sun, 30 Jan 2022 13:51:15 GMT</pubDate>
            <description><![CDATA[<p>_패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online 강의 Chapter 05.의 내용을 정리 했습니다.
<a href="https://fastcampus.co.kr/courses/202712/clips/">링크텍스트</a></p>
<p><strong>*분산분석 : 서로 다른 변수나 표본이 있을 때, 그것들을 비교하는 분석법</strong></p>
<p>*동일 기간, 같은 콘텐츠, 각 이벤트(총 3건)의 노출수를 12000회로 고정 후 노출시키고 주요 변수 영향도를 파악한다. </p>
<p>*배너의 위치에 따른 배너 통계</p>
<p>→ 이벤트 효과와 이벤트 안내 배너의 위치에 따라 클릭율이 달라진다. </p>
]]></description>
        </item>
        <item>
            <title><![CDATA[SNS 채널별 광고 효과 분석]]></title>
            <link>https://velog.io/@data_shirouto/SNS-%EC%B1%84%EB%84%90%EB%B3%84-%EA%B4%91%EA%B3%A0-%ED%9A%A8%EA%B3%BC-%EB%B6%84%EC%84%9D</link>
            <guid>https://velog.io/@data_shirouto/SNS-%EC%B1%84%EB%84%90%EB%B3%84-%EA%B4%91%EA%B3%A0-%ED%9A%A8%EA%B3%BC-%EB%B6%84%EC%84%9D</guid>
            <pubDate>Sun, 30 Jan 2022 13:37:44 GMT</pubDate>
            <description><![CDATA[<p>_패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online 강의 Chapter 05.의 내용을 정리 했습니다.
<a href="https://fastcampus.co.kr/courses/202712/clips/">링크텍스트</a></p>
<p><strong>*분산분석 : 서로 다른 변수나 표본이 있을 때, 그것들을 비교하는 분석법</strong></p>
<p>유입수 : 각 SNS 채널을 통해 (광고하는) 사이트에 유입시킨 수 
유입률 : 노출된 컨텐츠를 클릭한 사람이 실제로 얼마나 유입되었는가?
전환수 : 유입된 사람이 설정한 목표(회원 가입, 구매 등)에 도달한 수 
전환율 : 유입에서 얼마나 전환이 되었는가?</p>
<p>*광고 집행 비용 / 소재는 모두 동일하다.</p>
<p>*SNS 이용 연령대를 파악함(추정해보기)
: SNS를 이용하는 연령대에 따라서 전환수에 영향을 준다.</p>
<p><img src="https://images.velog.io/images/data_shirouto/post/ee3a309f-2d07-4517-b06c-ca3d50396319/220130_16.PNG" alt=""></p>
<p>*광고를 집행할 때 매체별로 효율이 다를 수 있다. 하지만 광고 집행/ 소재가 모두 동일하다고
한다면 각 매체의 효율을 결정짓는 요인으로는 &#39;연령대&#39;로 볼 수 있음 </p>
<p>*광고 매체 별 일자별 추이를 분석했을 때 전체 추이와 가장 유사한 추이를 보이는 광고 매체를 분석하고 그 매체를 이용하는 사람들을 분석함으로써 광고를 해야하는 대상(타겟팅)을 훨씬 더 확실하게 알아낼 수 있다. </p>
]]></description>
        </item>
        <item>
            <title><![CDATA[ANOVA를 활용한 가설 검정]]></title>
            <link>https://velog.io/@data_shirouto/ANOVA%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EA%B0%80%EC%84%A4-%EA%B2%80%EC%A0%95</link>
            <guid>https://velog.io/@data_shirouto/ANOVA%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EA%B0%80%EC%84%A4-%EA%B2%80%EC%A0%95</guid>
            <pubDate>Sun, 30 Jan 2022 13:13:06 GMT</pubDate>
            <description><![CDATA[<p>_패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 05.의 내용을 정리 했습니다.</p>
<p><strong>서로 다른 집단이 세 개 이상일 때 집단 간 평균의 차이를 검정
평균에 대한 비교이지만, 분산의 개념을 활용하여 검정하기 때문에 분산 분석이라고 불린다.</strong></p>
<p><img src="https://images.velog.io/images/data_shirouto/post/5a8f8077-6ce7-42e3-8ec6-65d36a050465/220130_14.PNG" alt=""></p>
<p><img src="https://images.velog.io/images/data_shirouto/post/edd6baa7-0ea4-4f5d-8e8c-4bb59e2419da/220130_15.PNG" alt=""></p>
<p><del>아... 너무 어렵네...</del></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[분산 분석]]></title>
            <link>https://velog.io/@data_shirouto/%EB%B6%84%EC%82%B0-%EB%B6%84%EC%84%9D</link>
            <guid>https://velog.io/@data_shirouto/%EB%B6%84%EC%82%B0-%EB%B6%84%EC%84%9D</guid>
            <pubDate>Sun, 30 Jan 2022 12:51:28 GMT</pubDate>
            <description><![CDATA[<p>_패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 05.의 내용을 정리 했습니다.
<a href="https://fastcampus.co.kr/courses/202712/clips/">링크텍스트</a></p>
<ul>
<li>상관분석 : 두 변수의 연관성은 어느 정도인가?<pre><code>     예) 아이스크림 가게의 매출과 기온의 상관성은 어느 정도인가?</code></pre>▶ 두 변수 간의 상관관계 정도를 나타내는 수치, 범위는 (-1, 1)</li>
</ul>
<p><img src="https://images.velog.io/images/data_shirouto/post/724c338b-99d7-475b-9281-a45c34ab2370/220130_11.PNG" alt=""></p>
<p><img src="https://images.velog.io/images/data_shirouto/post/e005fbf5-ca5f-4ca9-9d1c-282d3a7e9088/220130_12.PNG" alt=""></p>
<ul>
<li>T-test : &#39;서로 다른 두 표본의 평균 차이가 통계적으로 유의한가?&#39;를 검정<pre><code>    예) 홈페이지 A 위치에 배너를 놓았을 때 B 위치의 배너를 놓았을 때 
        매출액 차이가 통계적으로 유의한가?</code></pre></li>
</ul>
<p>▶ 귀무가설 : 두 집단의 평균이 서로 같다 vs 대립가설 : 두 집단의 평균이 다르다.</p>
<p>*<em>t-test를 사용하기 위한 가정 : 정규성 *</em></p>
<p><img src="https://images.velog.io/images/data_shirouto/post/0ba4077f-c7b9-41c4-aa90-4ef9a2d4770a/220130_13.PNG" alt=""></p>
<p>t-test : 서로 다른 두 집단의 평균이 통계적으로 유의한가?
         F-testf(등분산 검정) → t-검정(Student&#39;s t-test, Welch&#39;s t-est))</p>
<ul>
<li>Palred t-test : &#39;같은 그룹의 사전/사후 평균 차이가 있는가&#39;를 검정<pre><code>            예) 캠페인 광고 전후의 고객의 구매금액 차이가 통계적으로 유의한가?</code></pre></li>
</ul>
]]></description>
        </item>
        <item>
            <title><![CDATA[데이터 편집]]></title>
            <link>https://velog.io/@data_shirouto/%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%8E%B8%EC%A7%91</link>
            <guid>https://velog.io/@data_shirouto/%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%8E%B8%EC%A7%91</guid>
            <pubDate>Sun, 30 Jan 2022 12:11:51 GMT</pubDate>
            <description><![CDATA[<p><em>패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 04.의 내용을 정리 했습니다.</em>
<a href="https://fastcampus.co.kr/courses/202712/clips/">링크텍스트</a></p>
<p><strong>&quot;데이터 편집&quot;</strong></p>
<p>1) 원본 데이터를 받았을 때 폰트 크기를 줄이고 셀 넓이를 조절하여 가독성을 높이는 작업을 한다. </p>
<p>2) 첫 번째 A열은 항상 비워두는 것이 좋다 ; 수식과 함수를 이용해서 &#39;검증&#39;하는 용도로 사용
할 수 있고 데이터의 테두리를 쳐서 보았을 때 가독성을 높이는 방법이 된다. </p>
<p>3) 데이터를 보기 좋게 편집 : 빠르고 정확한 데이터 분석의 첫걸음</p>
<p>4) 데이터 분석은 현황 위에 &#39;해석&#39;이라는 가설을 세우는 작업</p>
<p><strong>&quot;If, Subtotal&quot;</strong></p>
<p>1) 원본 데이터를 받았을 때 분석하기 편리하도록 함수를 이용해서 원하는 텍스트를 입력 ;IF</p>
<p>2) 필터를 걸었을 때 원하는 값 또는 필요한 값만 집계 ; Subtotal</p>
<p><strong>&quot;Vlookup, Datedif&quot;</strong></p>
<p>1) Vlookup(Hlookup) : 참조해서 불러오기 (f4 : 절대 참조)</p>
<p>2) Datedif : 날짜와 날짜 사이의 간격을 구함(iferror 같이 응용하기)</p>
<p><strong>&quot;피벗 테이블&quot;</strong></p>
<p>1) 데이터 테이블을 빠르게 작업 할 수 있음</p>
<p><strong>&quot;데이터 필터링, 필드 추가&quot;</strong></p>
<p>1) 데이터가 입려되어 있는 모든 셀에는 필터가 걸려 있어야 함(확인 必)</p>
<p>2) 간단한 요약 테이블(countif, sumif)</p>
<p>3) 원본 테이블과 요약 테이블의 검증</p>
<p><strong>&quot;차트 만들기, 편집하기&quot;</strong></p>
<p><strong>&quot;다양한 형태의 차트(막대형, 꺽은선형, 원형)</strong></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[소비자가 광고를 본 다음 할 수 있는 모든 행동 '확률 변수']]></title>
            <link>https://velog.io/@data_shirouto/%EC%86%8C%EB%B9%84%EC%9E%90%EA%B0%80-%EA%B4%91%EA%B3%A0%EB%A5%BC-%EB%B3%B8-%EB%8B%A4%EC%9D%8C-%ED%95%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%AA%A8%EB%93%A0-%ED%96%89%EB%8F%99-%ED%99%95%EB%A5%A0-%EB%B3%80%EC%88%98</link>
            <guid>https://velog.io/@data_shirouto/%EC%86%8C%EB%B9%84%EC%9E%90%EA%B0%80-%EA%B4%91%EA%B3%A0%EB%A5%BC-%EB%B3%B8-%EB%8B%A4%EC%9D%8C-%ED%95%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%AA%A8%EB%93%A0-%ED%96%89%EB%8F%99-%ED%99%95%EB%A5%A0-%EB%B3%80%EC%88%98</guid>
            <pubDate>Sun, 30 Jan 2022 09:34:09 GMT</pubDate>
            <description><![CDATA[<p>_패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 02.의 내용을 정리 했습니다.
<a href="https://fastcampus.co.kr/courses/202712/clips/">링크텍스트</a></p>
<ul>
<li>확률변수 : 표본 공간 내에 있는 각 원소를 하나의 실수값에 대응시키는 함수,<pre><code>      이산형과 연속형으로 분류</code></pre></li>
</ul>
<p><img src="https://images.velog.io/images/data_shirouto/post/4613945e-baf1-4b3a-98a7-ee8cf7f4a1fc/220130_08.PNG" alt=""></p>
<p><img src="https://images.velog.io/images/data_shirouto/post/25fc9a6c-b300-4cf0-a365-eb09cae1dd05/220130_01.PNG" alt=""></p>
<p><img src="https://images.velog.io/images/data_shirouto/post/46af7127-6871-4692-af49-f228d4860fb9/220130_09.PNG" alt=""></p>
<ul>
<li>확률분포 : 확률 변수가 취할 수 있는 모든 값들과 이에 대응하는 각각의 확률을 계산할 수 있는 식, 표, 그래프</li>
</ul>
<p><img src="https://images.velog.io/images/data_shirouto/post/4af36dbe-7c0a-403d-9d76-a689cfe14b30/220130_10.PNG" alt=""></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[소비자가 광고를 보고 상품을 구매할 '확률' ]]></title>
            <link>https://velog.io/@data_shirouto/%EC%86%8C%EB%B9%84%EC%9E%90%EA%B0%80-%EA%B4%91%EA%B3%A0%EB%A5%BC-%EB%B3%B4%EA%B3%A0-%EC%83%81%ED%92%88%EC%9D%84-%EA%B5%AC%EB%A7%A4%ED%95%A0-%ED%99%95%EB%A5%A0</link>
            <guid>https://velog.io/@data_shirouto/%EC%86%8C%EB%B9%84%EC%9E%90%EA%B0%80-%EA%B4%91%EA%B3%A0%EB%A5%BC-%EB%B3%B4%EA%B3%A0-%EC%83%81%ED%92%88%EC%9D%84-%EA%B5%AC%EB%A7%A4%ED%95%A0-%ED%99%95%EB%A5%A0</guid>
            <pubDate>Sun, 30 Jan 2022 09:09:47 GMT</pubDate>
            <description><![CDATA[<p><em>패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 02.의 내용을 정리 했습니다.</em>
<a href="https://fastcampus.co.kr/courses/202712/clips/">링크텍스트</a></p>
<p>*확률</p>
<p>확률의 공리 : 몇 가지 조건을 설정하고 이를 만족하는 경우</p>
<p><img src="https://images.velog.io/images/data_shirouto/post/93c32838-67ec-4d26-a694-0e1669b41f59/220130_06.PNG" alt=""></p>
<ul>
<li><p>상호 배반 : 동싱에 발생할 수 없는 사상</p>
</li>
<li><p>종속 관계 : 두 사상 사이에 밀접한 관계가 있어 한 사상의 발생이 다른 사상의 발생에 영향을 미치는 것</p>
</li>
</ul>
<p>조건부 확률 : 종속 관계의 두 사상 A와 B에서, 첫번째 사상 A가 일어났다는 전제하에, 사상 B가 발생할 확률</p>
<p><img src="https://images.velog.io/images/data_shirouto/post/d7b771c4-ee92-4f3c-b7f1-746318d71b82/220130_07.PNG" alt=""></p>
<p>독립 관계 : 두 사상 사이에 밀접한 관계가 있어 한 사상의 발생이 다른 사상의 발생에 영향을 미치지 않는 것(&lt;-&gt; 종속 관계)</p>
]]></description>
        </item>
        <item>
            <title><![CDATA[자료 데이터 ]]></title>
            <link>https://velog.io/@data_shirouto/%EC%9E%90%EB%A3%8C-%EB%8D%B0%EC%9D%B4%ED%84%B0</link>
            <guid>https://velog.io/@data_shirouto/%EC%9E%90%EB%A3%8C-%EB%8D%B0%EC%9D%B4%ED%84%B0</guid>
            <pubDate>Sun, 30 Jan 2022 08:44:55 GMT</pubDate>
            <description><![CDATA[<p><em>패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 02.의 내용을 정리 했습니다.</em>
<a href="https://fastcampus.co.kr/courses/202712/clips/">링크텍스트</a></p>
<p>*기술 통계학
자료를 하나 하나 열거하기 보단 몇 가지 대표적인 통계량으로 파악하는 것이 더욱 효과적(특히 둘 이상의 집단을 비교할 때)</p>
<p>범주형 자료 : 숫자로 표현할 수 없는 자료
측정형(양적) 자료 : 숫자의 크기와 의미를 갖는 자료
<img src="https://images.velog.io/images/data_shirouto/post/2e45a69a-ed6b-4114-9170-e1b54589d740/220130_01.PNG" alt=""></p>
<p><img src="https://images.velog.io/images/data_shirouto/post/705ceb02-6ae5-45e1-837c-7e36d4619de4/220130_02.PNG" alt=""></p>
<p>자료의 기술 : 위치의 측도(자료들이 어느 위치에 가장 많이 모여 있는가, 또는 전체적으로 어떤 형태로 분포하고 있는가) </p>
<p>최빈값 : 자료 중에서 발생하는 도수가 가장 많은 값이지만 대표값으로는 부적절하다. </p>
<p>크기 순으로 배열한 자료가 있다고 했을 때 그 자료를 4등분 한 수는 사분위수, 100등분 한 수는 백분위수가 됨</p>
<p><img src="https://images.velog.io/images/data_shirouto/post/dda2ac11-45e0-4d39-971a-de528572b249/220130_03.PNG" alt=""></p>
<p>산포도 : 자료들이 퍼져 있는 정도</p>
<p><img src="https://images.velog.io/images/data_shirouto/post/9ca8921f-c81a-4ed2-b803-33cfe7d8a62b/220130_04.PNG" alt=""></p>
<p>분산 : 자료의 변동의 평균(변동이란, 관찰값과 평균과의 차의 제곱 / 분산은 관찰값들이 평균으로부터 떨어져 있는 정도를 의미)
<img src="https://images.velog.io/images/data_shirouto/post/3de47260-dc35-4711-8afd-e3872f55de0b/220130_05.PNG" alt=""></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[통계가 왜 필요할까?]]></title>
            <link>https://velog.io/@data_shirouto/%ED%86%B5%EA%B3%84%EA%B0%80-%EC%99%9C-%ED%95%84%EC%9A%94%ED%95%A0%EA%B9%8C</link>
            <guid>https://velog.io/@data_shirouto/%ED%86%B5%EA%B3%84%EA%B0%80-%EC%99%9C-%ED%95%84%EC%9A%94%ED%95%A0%EA%B9%8C</guid>
            <pubDate>Sun, 30 Jan 2022 08:21:29 GMT</pubDate>
            <description><![CDATA[<p><em>_패스트 캠퍼스 &#39;통계와 엑셀을 활용한 데이터 분석 올인원 패키지 Online&#39; 강의 Chapter 01.의 내용을 정리 했습니다.</em> 
<a href="https://fastcampus.co.kr/courses/202712/clips/">링크텍스트</a></p>
<p>-통계학이란?
관심의 대상이 되는 집단 즉, 모집단의 특성을 파악하기 위해 모집단으로부터 일부의 자료(표본, 우리가 가지고 있는 자료)를 수집, 정리, 요약, 분석하여 표본의 특성을 파악하고 이를 이용하여 모집단의 특성에 대해 추론하는 원리와 방법을 배우는 학문.</p>
<p>모집단 : (관심의 대상이 되는) 모든 관측값이나 측정값의 전체 집합
        예) A마트를 이용하는 모든 고객 집합, B공장 생산라인에서 사용하는 특수 기계 집합
<strong>*모수 : 모집단의 특성을 나타내는 수, 모평균, 모표준편차, 모비율</strong></p>
<p>표본 : 모집단 전체의 특성을 파악하기 위하여 모집단으로부터 추출된 일부분
      예) A마트를 이용하는 모든 고객을 대표하기 위해 추출된 200명의 고객들, B공장에서 선별된 기계 15대
통계량 : 표번의 특징을 나타내는 함수. 표본평균, 표본표준편차, 표본비율</p>
<ul>
<li>통계학을 통해 실무에서 얻을 수 있는 것?
자료에 근거한 합리적인 의사결정 </li>
</ul>
<p>: 이 과정에서 자료(데이터)를 어떻게 파악할 것인가.</p>
<ul>
<li><p>기술 통계학?
요약 통계량, 그래프 표 등을 이용하여 데이터를 정리, 요약하여 데이터의 전반적인 특성을 파악 ▶ 수치 요약 : 통계량(statistics) / 시가적 표현: 표, 그래프</p>
</li>
<li><p>추론 통계학?
데이터가 모집단으로부터 나왔다는 가정하에 모집단으로부터 추출된 표본을 사용하여 모집단의 특성을 파악하는 방법 ▶ 추정 : 점 추정, 구간 추정 / 가설 검정</p>
</li>
</ul>
<p><em><strong>실제 자료 분석 단계 : 기술 통계(탐색적 분석, EDA) 후 추론 통계</strong></em></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[LDA 진행 중]]></title>
            <link>https://velog.io/@data_shirouto/LDA-%EC%A7%84%ED%96%89-%EC%A4%91</link>
            <guid>https://velog.io/@data_shirouto/LDA-%EC%A7%84%ED%96%89-%EC%A4%91</guid>
            <pubDate>Tue, 25 Jan 2022 03:03:53 GMT</pubDate>
            <description><![CDATA[<p>*<em>스터디에서 공유받은 코드 중 일부 *</em></p>
<p>전체적인 로직과 흐름에 대해 이해를 못하고 있어 엄청 헤매고 있다. 
다음 스터디에서 관련 내용에 대해 팀원이 정리해주시기로 했는데 
사전에 공부를 해야 정리해주는 내용도 이해가 잘 될 것 같다...</p>
<p><del>▼여기까지는 어찌어찌해서 이해하고 있다...</del></p>
<pre><code># file이름과 그 안에 내용들 매칭해서 데이터프레임 생성

df = pd.DataFrame(columns=[&#39;file&#39;,&#39;text&#39;])

for pdf in os.listdir(&#39;Factiva-2020&#39;):

    p = &#39;C:/Users/skanj/Desktop/스터디/oo님 데이터/Factiva-2020/&#39;
    path = p + pdf

    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    laparams = LAParams()
    device = TextConverter(rsrcmgr,retstr, laparams = laparams)
    fp = open(path,&#39;rb&#39;)
    interpreter = PDFPageInterpreter(rsrcmgr, device)
    pagenos = set()

    for page in PDFPage.get_pages(fp,pagenos, caching = True,check_extractable=True):
        interpreter.process_page(page)

    text = retstr.getvalue()

    fp.close()
    device.close()
    retstr.close()

    df = df.append({&#39;file&#39;:pdf,&#39;text&#39;:text},ignore_index=True)</code></pre>]]></description>
        </item>
        <item>
            <title><![CDATA[선형 회귀 간단한 모델 구현하기]]></title>
            <link>https://velog.io/@data_shirouto/%EC%84%A0%ED%98%95-%ED%9A%8C%EA%B7%80-%EA%B0%84%EB%8B%A8%ED%95%9C-%EB%AA%A8%EB%8D%B8-%EA%B5%AC%ED%98%84%ED%95%98%EA%B8%B0</link>
            <guid>https://velog.io/@data_shirouto/%EC%84%A0%ED%98%95-%ED%9A%8C%EA%B7%80-%EA%B0%84%EB%8B%A8%ED%95%9C-%EB%AA%A8%EB%8D%B8-%EA%B5%AC%ED%98%84%ED%95%98%EA%B8%B0</guid>
            <pubDate>Sun, 23 Jan 2022 06:42:32 GMT</pubDate>
            <description><![CDATA[<pre><code>import numpy as np

data = [1,2,3,5]
arr = np.array(data)
arr.shape
</code></pre><p>(4,)</p>
<pre><code>arr.dtype</code></pre><p>dtype(&#39;int32&#39;)</p>
<pre><code>np.zeros((10,2))</code></pre><p>array([[0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.]])
; 10행 2열 짜리 행이 모두 0으로 채워진 행렬</p>
<pre><code>import pandas as pd
import matplotlib.pyplot as plt</code></pre><pre><code>a = np.array([5,10,15,20])
b = np.array([15,50,34,50])

result = pd.DataFrame({
    &quot;a&quot;:a,
    &quot;b&quot;:b

})

result</code></pre><pre><code>a    b</code></pre><p>0    5    15
1    10    50
2    15    34
3    20    50</p>
<pre><code>plt.plot(a,b,&#39;*&#39;)</code></pre><p><img src="https://images.velog.io/images/data_shirouto/post/60ed50cd-4094-43b5-8ed4-2896503d85f0/0123.PNG" alt=""></p>
<pre><code>#선형 회귀 모델 구현

height = np.array([188,150,180,197,160,175])
height = height.reshape(-1,1)

math = np.array([85,45,80,99,45,75])

from sklearn.linear_model import LinearRegression

line_fitter = LinearRegression()

line_fitter.fit(height,math)
#fit() 함수 : line_fitter.coef : 기울기 저장
#           : line_fitter.intercept_ : 절편 저장
</code></pre><p>LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)</p>
<pre><code>score_predict = line_fitter.predict(height)

plt.plot(height, math, &#39;x&#39;)
plt.plot(height, score_predict)
plt.show()</code></pre><p><img src="https://images.velog.io/images/data_shirouto/post/5362d3b2-05e9-47cf-bef0-362ce25fe588/0123_2.PNG" alt=""></p>
<pre><code>line_fitter.coef_</code></pre><p>array([1.23232984])</p>
<pre><code>line_fitter.intercept_</code></pre><p>-144.157722513089</p>
<pre><code>#성능 평가

from sklearn.metrics import mean_squared_error

print(&quot;Mean_Sqaured_Error :&quot;, mean_squared_error(score_predict, math))</code></pre><p>Mean_Sqaured_Error : 17.837150959860406(MSE)</p>
<pre><code>print(&quot;RMSE: &quot;, mean_squared_error(score_predict, math)**0.5)</code></pre><p>RMSE:  4.22340513802079</p>
<pre><code>print(&#39;score: &#39;, line_fitter.score(height, math))</code></pre><p>score:  0.9559122942289754</p>
<p>※인프런의 &#39;머신러닝 처음 시작하기&#39;의 선형 회귀 모델 구현을 참고했습니다.
<a href="https://www.inflearn.com/course/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%B2%98%EC%9D%8C-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0/lecture/38452?tab=note&amp;volume=1.00&amp;quality=auto&amp;speed=1.25">링크텍스트</a></p>
]]></description>
        </item>
    </channel>
</rss>