<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>seohyun_nam.log</title>
        <link>https://velog.io/</link>
        <description>Neuro-symbolic AI researcher</description>
        <lastBuildDate>Wed, 24 Jun 2026 07:53:21 GMT</lastBuildDate>
        <docs>https://validator.w3.org/feed/docs/rss2.html</docs>
        <generator>https://github.com/jpmonette/feed</generator>
        <image>
            <title>seohyun_nam.log</title>
            <url>https://velog.velcdn.com/images/seohyun_nam/profile/81be733f-5a2b-4980-8ca5-ea8f80e56a63/image.jpg</url>
            <link>https://velog.io/</link>
        </image>
        <copyright>Copyright (C) 2019. seohyun_nam.log. All rights reserved.</copyright>
        <atom:link href="https://v2.velog.io/rss/seohyun_nam" rel="self" type="application/rss+xml"/>
        <item>
            <title><![CDATA[C-ITS: 차세대 지능형 교통시스템]]></title>
            <link>https://velog.io/@seohyun_nam/C-ITS-%EC%B0%A8%EC%84%B8%EB%8C%80-%EC%A7%80%EB%8A%A5%ED%98%95-%EA%B5%90%ED%86%B5%EC%8B%9C%EC%8A%A4%ED%85%9C</link>
            <guid>https://velog.io/@seohyun_nam/C-ITS-%EC%B0%A8%EC%84%B8%EB%8C%80-%EC%A7%80%EB%8A%A5%ED%98%95-%EA%B5%90%ED%86%B5%EC%8B%9C%EC%8A%A4%ED%85%9C</guid>
            <pubDate>Wed, 24 Jun 2026 07:53:21 GMT</pubDate>
            <description><![CDATA[<p>자율주행 시대의 도래는 단순히 자동차가 스스로 움직이는 기술만으로 완성되는 것이 아닙니다. </p>
<p>차량의 <strong>인지·판단·제어 기술</strong>은 물론, <strong>도로 인프라, 통신 시스템, 관제 플랫폼, 정밀 지도, 테스트 베드</strong> 등 다양한 기반 기술이 <strong>함께 발전</strong>해야 합니다. </p>
<p>특히 완전 자율주행에 가까운 <strong>레벨 4 자율주행</strong>을 구현하기 위해서는 차량이 주변 환경을 더 넓고 정확하게 이해할 수 있어야 합니다. </p>
<h2 id="c-its-이란">C-ITS 이란?</h2>
<blockquote>
<p>C-ITS (Cooperative-Intelligent Transport Systems) 협력 지능형 교통 시스템을 의미</p>
</blockquote>
<p>기존의 ITS가 내비게이션 교통정보, 하이패스, 버스 도착 정보, 실시간 신호 제어처럼 교통 정보를 수집하고 제공하는 데 초점을 두었다면, </p>
<p>C-ITS는 여기서 한 단계 더 발전해 <strong>차량과 차량</strong>, <strong>차량과 도로 인프라</strong>가 <strong>실시간으로 정보</strong>를 주고받으며 도로 위 상황에 함께 대응하는 것이 특징입니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/c8aa13ad-0064-43d0-acdf-7c471783b057/image.jpg" alt=""></p>
<h2 id="v2x-통신이란">V2X 통신이란?</h2>
<blockquote>
<p>V2X (Vehicle to Everything) 차량과 모든 사물이 연결되는 통신 기술</p>
</blockquote>
<p>차량과 차량이 연결되는 <strong>V2V</strong>, 차량과 도로 인프라가 연결되는 <strong>V2I</strong>, 차량과 보행자가 연결되는 <strong>V2P</strong>, 차량과 네트워크가 연결되는 <strong>V2N</strong> 등이 여기에 포함됩니다. </p>
<p>이를 통해 <strong>차량</strong>은 <strong>자신의 센서만으로는 확인하기 어려운 정보</strong>까지 미리 파악할 수 있습니다.</p>
<h2 id="c-its-구성요소">C-ITS 구성요소</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/9323fb09-9caf-47a3-ba2e-f8abf939b430/image.jpg" alt=""></p>
<p><strong>C-ITS</strong>는 <strong>차량 단말기, 도로 인프라, 관제센터</strong>로 구성됩니다. </p>
<blockquote>
<ul>
<li><strong>차량</strong>에는 V2X 단말기와 ADAS, 디스플레이 등이 탑재되어 도로와 정보를 주고받습니다. </li>
</ul>
</blockquote>
<blockquote>
<ul>
<li><strong>도로</strong>에는 신호제어기, 검지기, CCTV, 노변기지국 등이 설치되어 교통 상황, 기상 정보, 보행자 정보 등을 수집합니다. </li>
</ul>
</blockquote>
<blockquote>
<ul>
<li><strong>관제센터</strong>는 이렇게 수집된 데이터를 분석해 최적의 교통 정보를 제공하고, 사고나 정체 상황에 빠르게 대응할 수 있도록 지원합니다.</li>
</ul>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/15cecbfa-af53-4f64-b5c1-0884b892cbc0/image.jpg" alt=""></p>
<h2 id="자율주행-테스트-베드란">자율주행 테스트 베드란?</h2>
<blockquote>
<p>자율주행 기술은 실제 도로에 바로 적용되기 전에 다양한 상황에서 안전성을 검증해야 합니다. 이를 위해 실제 도로와 유사한 환경을 구현한 시험 공간이 필요한데, 이것이 <strong>자율주행 테스트 베드</strong>입니다. </p>
</blockquote>
<p>테스트 베드는 단순한 주행 시험장이 아니라, <strong>차량 통신 설비</strong>, <strong>통합 관제 시스템</strong>, <strong>데이터 분석 시스템</strong>, <strong>서비스 플랫폼</strong>까지 포함하는 종합적인 검증 인프라입니다.</p>
<p><strong>현대오토에버</strong>는 이러한 자율주행 인프라 구축 분야에서 중요한 역할을 하고 있습니다. </p>
<p>2017년 경기도 화성의 자율주행 실험도시 K-City에 C-ITS 도로 환경, 차량 정보 수집 시스템, 통합 평가·관제 시스템을 구축하며 자율주행 테스트 베드 사업에 본격적으로 참여했습니다. 이후 서울외곽순환도로, 경부고속도로, 중부고속도로 등 실제 도로에서 진행된 C-ITS 실증사업도 수행했습니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/4d1e6a00-1ce7-4bfe-9723-308f17094d1b/image.jpg" alt=""></p>
<p>또한 <strong>새만금 상용차 자율주행 테스트 베드와 대구 자율주행 테스트 베드 구축 사업을 수주</strong>하며 자율주행 상용화를 위한 기반을 넓혀가고 있습니다. </p>
<p>특히 새만금 상용차 자율주행 테스트 베드는 물류 산업의 미래와 밀접하게 연결되어 있습니다. 약 11km 구간의 주행 시험장에 <strong>국내 최초의 상용차 자율주행 테스트 베드와 통합 관제 시스템을 구축</strong>하고, <strong>고속 자율주행과 군집 주행 기술을 검증할 수 있는 환경을 제공</strong>하는 것이 목표입니다.</p>
<h2 id="군집-주행이란">군집 주행이란?</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/132b9760-96a5-4a4c-8108-9487fd1804ac/image.jpg" alt=""></p>
<blockquote>
<p><strong>군집 주행</strong>은 <strong>여러 대의 차량이 열차처럼 일정한 간격을 유지하며 주행하는 기술</strong></p>
</blockquote>
<ul>
<li><p>선두 차량이 바람을 막아 뒤따르는 차량의 연비를 높일 수 있고, 차량 간 정보를 실시간으로 공유해 급정거, 과속, 연쇄 추돌 위험을 줄일 수 있습니다. </p>
</li>
<li><p>특히 화물차와 같은 상용차 분야에서는 운송 효율을 크게 높이고 운전자의 피로를 줄일 수 있어 미래 물류 산업의 핵심 기술로 주목받고 있습니다.</p>
</li>
<li><p>하지만 군집 주행이 실제 도로에서 안전하게 작동하기 위해서는 다양한 <strong>돌발 상황을 시험할 수 있는 환경이 필요</strong>합니다. </p>
</li>
</ul>
<p><strong>고속 주행 중 차량 간 간격 유지, 급정거 대응, 교차로 통과, 돌발 장애물 회피, 통신 지연 상황 등 수많은 시나리오</strong>를 검증해야 하기 때문입니다. 따라서 상용차 전용 자율주행 테스트 베드와 <strong>C-ITS 기반 관제 시스템</strong>은 <strong>군집 주행 상용화를 위한 필수 조건</strong>입니다.</p>
<p>결국 자율주행 시대는 자동차 한 대의 기술만으로 완성되는 것이 아닙니다. <strong>차량, 도로, 통신망, 관제센터, 정밀 지도, 테스트 베드가 하나의 거대한 시스템으로 연결</strong>되어야 합니다. </p>
<p><strong>C-ITS</strong>는 이러한 <strong>연결의 중심에 있는 기술</strong>이며, <strong>자율주행 테스트 베드</strong>는 <strong>그 기술을 안전하게 검증하는 공간</strong>입니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/7a61329d-46cd-450f-87d0-acf6d766431c/image.jpg" alt=""></p>
<p>앞으로 자율주행차가 도로 위에서 안전하게 움직이고, 상용차가 군집 주행으로 물류 효율을 높이며, 보행자와 차량이 더 안전하게 공존하기 위해서는 <strong>C-ITS</strong>와 <strong>V2X</strong> 기술의 발전이 필수적입니다. </p>
<p><strong>현대오토에버</strong>와 <strong>현대모비스</strong>가 추진하는 자율주행 인프라와 통신 기술은 완전 자율주행 시대를 앞당기는 중요한 기반이 될 것입니다.</p>
<p>이상으로 모빌리티 산업 이슈 스터디 마지막 포스팅을 마치도록 하겠습니다.</p>
<p>더 많은 모빌리티 이야기가 궁금하시면 하단의 H 모빌리티 클래스 공식 인스타그램을 확인해주세요!</p>
<p><a href="https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D">https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D</a></p>
<p>&quot;최적의 결정을 설계하는 자율주행 판단 전문가 남서현 앰버서더&quot; 였습니다!</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/4d575bc1-237b-4bfd-8369-c962187fc9cf/image.jpg" alt=""></p>
<p>#H-모빌리티 클래스 #H-모빌리티 클래스 앰버서더 #대외활동 #현대자동차 #자율주행 #판단 #C-ITS #정밀지도 #V2X #V2V #V2I #V2P #군집주행 #테스트 베드</p>
<h3 id="reference">Reference</h3>
<p><a href="https://www.hyundaimotorgroup.com/ko/story/CONT0000000000032233">https://www.hyundaimotorgroup.com/ko/story/CONT0000000000032233</a>
<a href="https://www.hyundaimotorgroup.com/ko/story/CONT0000000000016227">https://www.hyundaimotorgroup.com/ko/story/CONT0000000000016227</a>
<a href="https://www.hyundaimotorgroup.com/ko/story/CONT0000000000089908">https://www.hyundaimotorgroup.com/ko/story/CONT0000000000089908</a>
<a href="https://www.meconomynews.com/news/articleView.html?idxno=85644">https://www.meconomynews.com/news/articleView.html?idxno=85644</a>
<a href="https://blog.hyundai-transys.com/426">https://blog.hyundai-transys.com/426</a>
<a href="https://ownersmanual.hyundai.com/docview/webhelp/Hyundai/d20b908e-fe25-4efb-b1d1-def21e2627e4/ida67340b7622.html">https://ownersmanual.hyundai.com/docview/webhelp/Hyundai/d20b908e-fe25-4efb-b1d1-def21e2627e4/ida67340b7622.html</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[E2E: 사람처럼 스스로 판단하는 자율주행 기술]]></title>
            <link>https://velog.io/@seohyun_nam/E2E-%EC%82%AC%EB%9E%8C%EC%B2%98%EB%9F%BC-%EC%8A%A4%EC%8A%A4%EB%A1%9C-%ED%8C%90%EB%8B%A8%ED%95%98%EB%8A%94-%EC%9E%90%EC%9C%A8%EC%A3%BC%ED%96%89-%EA%B8%B0%EC%88%A0</link>
            <guid>https://velog.io/@seohyun_nam/E2E-%EC%82%AC%EB%9E%8C%EC%B2%98%EB%9F%BC-%EC%8A%A4%EC%8A%A4%EB%A1%9C-%ED%8C%90%EB%8B%A8%ED%95%98%EB%8A%94-%EC%9E%90%EC%9C%A8%EC%A3%BC%ED%96%89-%EA%B8%B0%EC%88%A0</guid>
            <pubDate>Wed, 17 Jun 2026 07:10:36 GMT</pubDate>
            <description><![CDATA[<blockquote>
<p><strong>자율주행 시스템</strong>에는 대표적으로 3가지 <strong>판단</strong> 방식이 있습니다. <strong>Rule-based</strong> 방식, <strong>E2E (End-to-End)</strong> 방식, <strong>LDM (Large Driving Model)</strong> </p>
</blockquote>
<table>
<thead>
<tr>
<th>구분</th>
<th>Rule-Based</th>
<th>E2E</th>
<th>LDM(VLA)</th>
</tr>
</thead>
<tbody><tr>
<td>판단 방식</td>
<td>규칙 기반</td>
<td>데이터 학습 기반</td>
<td>추론 기반</td>
</tr>
<tr>
<td>개발 방법</td>
<td>시나리오 설계</td>
<td>대규모 주행 데이터 학습</td>
<td>멀티모달 학습 + 추론</td>
</tr>
<tr>
<td>장점</td>
<td>안정성, 검증 용이</td>
<td>복잡한 환경 대응</td>
<td>설명 가능한 의사결정</td>
</tr>
<tr>
<td>단점</td>
<td>예외 상황 취약</td>
<td>블랙박스 문제</td>
<td>높은 연산 비용</td>
</tr>
<tr>
<td>대표 기업</td>
<td>Waymo 초기 모델</td>
<td>Tesla FSD</td>
<td>42dot, NVIDIA, Motional</td>
</tr>
</tbody></table>
<h2 id="rule-based-규칙기반-판단-기술이란">Rule-based (규칙기반) 판단 기술이란?</h2>
<blockquote>
<p>지정되어 있는 명령에 따라서 움직일 수 있는 자율주행차들, 명령이 없으면 움직일 수 없는 차들, 날씨, 보행자들 등 다양한 특수한 시나리오를 설계해 상황별로 대응하는 방식으로 <strong>규칙을 미리 정해두고, 명령대로만 움직이는 방식</strong></p>
</blockquote>
<ul>
<li><p>복잡한 판단보다 <strong>빠른 반응</strong>이 필요한 순간에는 <strong>Rule-based 방식이 유리</strong>하지만, 이 접근 방식은 예상하지 못한 상황이 생기면 시나리오를 하나하나 새로 만들어야 한다는 단점이 존재합니다. </p>
</li>
<li><p>이 방식의 경우, 규칙을 벗어난 도로위의 <strong>예외적 상황에 대한 대처능력은 떨어집니다</strong>.</p>
</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/d7f19528-8a60-4b7f-bc0e-eac06b93ffba/image.jpg" alt=""></p>
<h2 id="e2e-end-to-end-판단-기술이란">E2E (End-to-End) 판단 기술이란?</h2>
<blockquote>
<p>일일이 규칙을 가르치지 않아도 <strong>데이터 학습</strong>만으로 주행을 터득하고, <strong>인지부터 제어까지 스스로 판단</strong>해 어떤 도로든 달릴 수 있는 방식</p>
</blockquote>
<ul>
<li><p>End-to-end 방식은 Rule-Based 방식과 달리 모든 과정을 <strong>한 번에 처리</strong>합니다. AI 학습에 필요한 주행 데이터가 쌓일수록 자연스럽게 별도의 코딩 수정 없이도 &#39;<strong>엣지 케이스</strong>&#39;(예외적 상황)에 대한 대응력이 고도화됩니다. </p>
</li>
<li><p>하지만 이 접근 방식은 AI의 판단 근거를 알 수 없는 <strong>&quot;블랙박스 현상&quot;</strong> 때문에 사고 발생시, <strong>원인 규명이 어렵다는 단점</strong>이 존재합니다.</p>
</li>
</ul>
<h2 id="ldm-large-driving-model-이란">LDM (Large Driving Model) 이란?</h2>
<blockquote>
<p><strong>Large Driving Model(LDM)</strong>은 <strong>대규모 주행 데이터</strong>와 <strong>언어 모델 기반 추론 능력</strong>을 <strong>결합</strong>한 차세대 자율주행 AI</p>
</blockquote>
<ul>
<li>일반적인 E2E 모델이 입력과 출력을 직접 연결하는 방식이라면, LDM은 다양한 <strong>도로 상황</strong>과 <strong>교통 규칙</strong>, <strong>운전자 의도</strong>를 <strong>이해</strong>하고 <strong>추론</strong>하여 행동을 결정할 수 있습니다.</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/4a1bdb74-3935-41a7-994f-2a4d8e45839a/image.jpg" alt=""></p>
<h2 id="vla-vision-language-action-이란">VLA (Vision Language Action) 이란?</h2>
<blockquote>
<p>인공지능이 <strong>인간의 주행 데이터</strong>를 <strong>모방 학습(Imitation Learning)</strong> 하는 <strong>E2E</strong>에 <strong>추론 능력을 추가</strong>하여 <strong>운전자 행동</strong>에 대한 <strong>인과관계를 추론</strong>해 학습하기 때문에 AI 의사결정 과정에 대한 <strong>구체적인 설명을 제공</strong>할 수 있는 모델</p>
</blockquote>
<ul>
<li><p><strong><em>VLA(Vision-Language-Action)</em></strong> 는 기존 E2E 자율주행의 발전된 형태로 볼 수 있습니다. </p>
</li>
<li><p>E2E가 센서 입력을 직접 조향·가감속 명령으로 연결하는 데 집중했다면, <em><strong>VLA</strong>_는 **_언어 모델을 활용</em>** 하여 <em><strong>주행 상황을 이해</strong>_하고 **_추론</em>**합니다.</p>
</li>
</ul>
<p>E2E모델의 한계를 보완한 비전, 언어, 행동의 Reasoning model (VLA)가 등장하게 되면서 예상치 못한 순간, 튀어나오는 보행자등의 돌발 상황을 감지, 사고 방지를 위해 급제동을 결정하는등의 <strong>추론과정</strong>을 <strong>언어로 설명</strong>가능해지게 되었습니다. </p>
<p>예를들어, 도로에 굴러온 공을 보고 &#39;아이가 나올 수 있어 정차한다&#39;는 정차 이유를 설명할 수 있게 됩니다. 바로 이점 때문에, Vision Language Action model은 E2E의 <strong>&quot;블랙박스 현상&quot;</strong>을 해소할 수 있어 자율주행 기술을 고도화하고 법적 책임을 명확히 할 수 있게 됩니다.</p>
<blockquote>
<p><strong>판단의 과정</strong>을 공개하는 기술적인 진화로 인해 충돌 방지를 위한 즉각적인 브레이크 제동과 같은 <strong>&quot;행동 (Action)&quot;</strong>이 가능해지게 되었습니다.</p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/90dc1aea-fdba-4f8c-b308-a7d1901f2f3e/image.jpg" alt="">
<strong>모셔널(Motional)</strong>은 Rule-based, E2E, LDM(Large Driving Model)을 조합한 <strong>하이브리드 전략</strong>을 취하고 있는데, 이로써 매 상황마다 <strong>최적의 방식</strong>을 결합 가능하여 <strong>유연한 대응</strong>이 가능하게 됩니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/5c193ebe-bd90-4569-963c-4b980f3251f7/image.jpg" alt=""></p>
<p><strong>현대자동차그룹</strong>은 SDV(Software Defined Vehicle) 전략의 핵심 기술로 VLA 기반 자율주행을 주목하고 있습니다. <strong>포티투닷</strong>이 개발 중인 <strong>Atria AI</strong>는 기존 E2E 기반 주행 모델에 <strong>대규모 언어 모델(LLM)</strong>의 추론 능력을 결합하여 차량이 주변 환경을 이해하고 행동 이유를 설명할 수 있는 차세대 자율주행 플랫폼을 목표로 하고 있습니다. 이에 따라 현대차그룹은 &quot;<strong>포티투닷-엔비디아-모셔널</strong>&quot;로 이뤄진 <strong>자율주행 협업 체계</strong>를 구축할 것으로 전망되고 있습니다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/9e169b5f-5bbd-4494-ad0d-c09eadb5a8c4/image.jpg" alt=""></p>
<ul>
<li><p>자율주행 기술은 Rule-Based에서 E2E로, 다시 <strong>E2E</strong>에서** VLA 기반 LDM**으로 발전하고 있습니다. </p>
</li>
<li><p>과거에는 차량이 정해진 규칙을 수행하는 수준이었다면, 이제는 <strong>주변 상황을 이해</strong>하고 스스로 <strong>추론하며 그 이유를 설명</strong>할 수 있는 단계로 진화하고 있습니다. </p>
</li>
<li><p>향후 <strong>완전 자율주행(Level 4~5)의 실현</strong>을 위해서는 높은 주행 성능뿐 아니라 설명 가능성과 안전성 확보가 중요한 과제가 될 것으로 보입니다.</p>
</li>
</ul>
<p>이상으로 모빌리티 산업 이슈 스터디 네번째 포스팅을 마치도록 하겠습니다.</p>
<p>더 많은 모빌리티 이야기가 궁금하시면 하단의 H 모빌리티 클래스 공식 인스타그램을 확인해주세요!</p>
<p>&quot;최적의 결정을 설계하는 자율주행 판단 전문가 남서현 앰버서더&quot; 였습니다!<img src="https://velog.velcdn.com/images/seohyun_nam/post/90547314-558e-4de2-a47e-c0a0af4c0d40/image.jpg" alt=""></p>
<p>#H-모빌리티 클래스 #H-모빌리티 클래스 앰버서더 #대외활동 #현대자동차 #모셔널 #포티투닷 #AVP #자율주행 #판단 #Rule-based #E2E #블랙박스 #의사결정 #VLA #맥락 #추론</p>
<h3 id="reference">Reference</h3>
<p><a href="https://www.hyundaimotorgroup.com/ko/tv/hyundai-autonomous-driving-e2e-technology">https://www.hyundaimotorgroup.com/ko/tv/hyundai-autonomous-driving-e2e-technology</a>
<a href="https://www.hyundaimotorgroup.com/ko/tv/autonomous-driving-rule-based-system">https://www.hyundaimotorgroup.com/ko/tv/autonomous-driving-rule-based-system</a>
<a href="https://www.42dot.ai/blog/164">https://www.42dot.ai/blog/164</a>
<a href="https://www.youtube.com/watch?v=1ZG63np_HoU">https://www.youtube.com/watch?v=1ZG63np_HoU</a>
<a href="https://www.hyundaimotorgroup.com/ko/story/hmg-tech-talent-forum-2026-series-2-minwoo-park-head-avp-division">https://www.hyundaimotorgroup.com/ko/story/hmg-tech-talent-forum-2026-series-2-minwoo-park-head-avp-division</a>
<a href="https://www.hyundaimotorgroup.com/ko/story/hyundai-motor-group-autonomous-driving-technology-advancement">https://www.hyundaimotorgroup.com/ko/story/hyundai-motor-group-autonomous-driving-technology-advancement</a>
<a href="https://www.newsway.co.kr/news/view?ud=2026061009285900399">https://www.newsway.co.kr/news/view?ud=2026061009285900399</a>
<a href="https://www.yna.co.kr/view/AKR20260608179900003">https://www.yna.co.kr/view/AKR20260608179900003</a>
<a href="https://www.news1.kr/industry/auto-industry/6192430">https://www.news1.kr/industry/auto-industry/6192430</a>
<a href="https://www.asiae.co.kr/article/2026033015441074056">https://www.asiae.co.kr/article/2026033015441074056</a>
<a href="https://raft.github.io/">https://raft.github.io/</a>
<a href="https://aws.amazon.com/ko/blogs/tech/building-an-end-to-end-physical-ai-data-pipeline-for-autonomous-vehicle-3-0-on-aws-with-nvidia/">https://aws.amazon.com/ko/blogs/tech/building-an-end-to-end-physical-ai-data-pipeline-for-autonomous-vehicle-3-0-on-aws-with-nvidia/</a>
<a href="https://ai.plainenglish.io/from-seeing-to-doing-how-vla-models-are-rewriting-the-code-of-autonomous-driving-02711589b3d6">https://ai.plainenglish.io/from-seeing-to-doing-how-vla-models-are-rewriting-the-code-of-autonomous-driving-02711589b3d6</a>
<a href="https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D">https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[routo: 모빌리티 혁신을 돕는 데이터 플랫폼 ]]></title>
            <link>https://velog.io/@seohyun_nam/routo-%EB%AA%A8%EB%B9%8C%EB%A6%AC%ED%8B%B0-%ED%98%81%EC%8B%A0%EC%9D%84-%EB%8F%95%EB%8A%94-%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%94%8C%EB%9E%AB%ED%8F%BC</link>
            <guid>https://velog.io/@seohyun_nam/routo-%EB%AA%A8%EB%B9%8C%EB%A6%AC%ED%8B%B0-%ED%98%81%EC%8B%A0%EC%9D%84-%EB%8F%95%EB%8A%94-%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%94%8C%EB%9E%AB%ED%8F%BC</guid>
            <pubDate>Tue, 09 Jun 2026 01:18:39 GMT</pubDate>
            <description><![CDATA[<h2 id="sdv-시대의-지도-플랫폼-routo가-그리는-미래">SDV 시대의 지도 플랫폼, routo가 그리는 미래</h2>
<blockquote>
<ul>
<li><strong>Software Defined Vehicle (SDV)</strong> 시대가 도래하면서 자동차는 단순한 이동 수단을 넘어 하나의 <strong>소프트웨어 플랫폼</strong>으로 진화하고 있습니다. </li>
</ul>
</blockquote>
<ul>
<li>차량 내부 기능뿐 아니라 <strong>내비게이션, 물류, 스마트시티, 자율주행</strong> 서비스까지 데이터 기반으로 연결되면서 <strong>위치 정보(Location Data)</strong>의 중요성은 더욱 커짐에 따라 <strong>현대오토에버</strong>는 이러한 변화에 대응하기 위해 <strong>위치 기반 데이터 플랫폼</strong>인 <strong>routo</strong> 를 운영하고 있습니다.</li>
</ul>
<blockquote>
<p><em><strong>routo</strong>는 단순한 지도 서비스가 아니라 다양한 기업이 <strong>지도 데이터</strong>와 <strong>위치 정보</strong>를 활용할 수 있도록 <strong>API</strong>와 <strong>SDK</strong>를 제공하는 <strong>B2B 플랫폼</strong>입니다.</em></p>
</blockquote>
<h2 id="routo란">routo란?</h2>
<ul>
<li><p><strong>routo</strong>는 Route와 Protocol의 합성어로 &quot;<em><strong>이동의 경로와 데이터의 경로를 연결한다</strong></em>&quot; 는 의미를 담고 있습니다.</p>
</li>
<li><p>기존 소비자 대상(B2C) 지도 서비스가 사용자의 길 찾기를 지원한다면, <strong>routo</strong>는 <strong>기업</strong>들이 <strong>위치 기반 서비스를 구축</strong>할 수 있도록 지원하는 <strong>B2B 플랫폼</strong>입니다.</p>
</li>
<li><p>특히** 현대자동차그룹<strong>이 축적한 **차량 데이터</strong>를 활용하여 <strong>고품질 위치 서비스를 제공</strong>하는 것이 특징입니다.</p>
</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/55e513d0-dbe5-4dd0-9ed4-6595b71ffc40/image.jpg" alt=""></p>
<h2 id="routo의-핵심-구조">routo의 핵심 구조</h2>
<p>루토의 핵심은 <strong>데이터 선순환 구조(Data Flywheel)</strong> 입니다.</p>
<pre><code>차량 및 사용자 데이터 수집
        ↓
데이터 정제 및 검증
        ↓
지도 서비스 반영
        ↓
사용자 경험 향상
        ↓
추가 데이터 생성
        ↓
재학습 및 고도화</code></pre><p>SDV 환경에서는 <strong>차량</strong> 자체가 <strong>센서 역할</strong>을 수행하며 <strong>지속적으로 데이터를 생산</strong>합니다.</p>
<p>이러한 데이터는 루토 플랫폼을 통해 다시 서비스 품질 향상에 활용되고 있습니다.</p>
<h2 id="routo의-주요-api">routo의 주요 API</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/a25f0924-3a4c-43df-90bf-ea117d9c5490/image.jpg" alt=""></p>
<h3 id="1-maps-api">1. Maps API</h3>
<p>실내 주차장과 같은 <strong>복잡한 공간을 정밀하게 표현</strong>합니다.</p>
<ul>
<li>주요 기능</li>
</ul>
<blockquote>
<p>실내 지도 제공
층별 정보 제공
주차 위치 확인
출입구 안내</p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/80186b5b-da7a-4e36-b903-dc20b9fcf99c/image.jpg" alt=""></p>
<ul>
<li>적용 사례</li>
</ul>
<blockquote>
<p>코엑스
롯데월드
현대백화점
현대 디에이치 반포 라클라스</p>
</blockquote>
<h3 id="2-places-api">2. Places API</h3>
<p><strong>실시간 장소 검색</strong> 서비스 입니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/779d2d27-eaac-4b41-a833-fc28b61eeb6a/image.jpg" alt=""></p>
<ul>
<li>특징</li>
</ul>
<blockquote>
<p>최신 상권 정보 반영
사용자 의도 기반 검색
신규 매장 실시간 업데이트</p>
</blockquote>
<ul>
<li>예시</li>
</ul>
<pre><code>&quot;강남 카페&quot;
    ↓
사용자 의도 분석
    ↓
주변 인기 카페 추천</code></pre><h3 id="3-geo-api">3. Geo API</h3>
<p><strong>주소</strong>와 <strong>좌표</strong>를 상호 변환하는 기능입니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/83b5490c-2f2a-4828-9bd2-88eab22d1d71/image.jpg" alt=""></p>
<ul>
<li>대표 기능</li>
</ul>
<pre><code>Geocoding
주소 → 좌표
Reverse Geocoding
좌표 → 주소

예시

서울 강남구 테헤란로
        ↓
위도/경도 변환

또는

GPS 좌표
      ↓
도로명 주소 반환</code></pre><p>택시 호출 서비스나 배달 서비스에서 필수적으로 사용됩니다.</p>
<h3 id="4-directions-api">4. Directions API</h3>
<p>최적 경로 탐색 기능입니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/fa22095e-75d0-4a1c-bba6-3e8b732a1de4/image.jpg" alt=""></p>
<ul>
<li>특징</li>
</ul>
<blockquote>
<p>다중 경유지 지원
교통수단 연계
상용차 전용 경로 제공</p>
</blockquote>
<p>특히 일반 지도 서비스와 차별화되는 부분은 <strong>상용차 경로 최적화</strong>입니다.</p>
<ul>
<li>고려 요소</li>
</ul>
<blockquote>
<p>교량 하중 제한
터널 높이 제한
차량 크기
물류 이동 경로</p>
</blockquote>
<p><strong>현대글로비스</strong> 물류 시스템에도 활용되고 있습니다.</p>
<h2 id="routo-특징">routo 특징</h2>
<h3 id="1-daily-update">1. Daily Update</h3>
<p>지도 데이터의 최신성을 유지하기 위해 <strong>일 단위 업데이트를 수행</strong>합니다.</p>
<ul>
<li>반영 대상</li>
</ul>
<blockquote>
<p>신규 도로
신규 상점
공사 구간
교통 정보</p>
</blockquote>
<p>실시간에 가까운 지도 갱신이 가능합니다.</p>
<h3 id="2-3d-visualization">2. 3D Visualization</h3>
<p>루토는 단순한 2D 지도 제공에 그치지 않는데, 대표 사례가** 벚꽃길 테마 지도**입니다.</p>
<ul>
<li>활용 기술</li>
</ul>
<blockquote>
<p>3D 모델링
GIS 데이터
Data Mashup</p>
</blockquote>
<p>이를 통해 사용자는 지도 위에서 보다 <strong>직관적인 공간 경험</strong>을 얻을 수 있습니다.</p>
<h3 id="3-global-coverage">3. Global Coverage</h3>
<p>루토는 국내 지도뿐 아니라 <strong>글로벌 지도 데이터</strong>도 지원합니다.</p>
<ul>
<li>활용 기술</li>
</ul>
<blockquote>
<p>해외 서비스 개발
글로벌 모빌리티 플랫폼 구축
글로벌 내비게이션 서비스</p>
</blockquote>
<h2 id="sdv-시대에서의-routo">SDV 시대에서의 routo</h2>
<p><strong>SDV</strong> 시대에는 차량이 단순히 이동하는 기계가 아니라 <strong>지속적으로 데이터를 생산하는 플랫폼</strong>이 되고 있습니다.</p>
<blockquote>
<p>자율주행
스마트시티
로보틱스
MaaS(Mobility as a Service)
물류 최적화</p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/3f11845f-7fa9-43ed-bc1c-11f613aea08c/image.jpg" alt=""></p>
<ul>
<li><p><strong>routo</strong>는 이러한 미래 모빌리티 생태계에서 &quot;지도 서비스&quot; 가 아닌 &quot;<strong>위치 데이터 플랫폼</strong>&quot; 으로 진화하고 있습니다.</p>
</li>
<li><p>또한, 단순히 길을 안내하는 지도를 넘어 <strong>차량 데이터, 위치 데이터, 실시간 공간 정보를 연결하는 모빌리티 플랫폼</strong>으로 발전하고 있습니다.</p>
</li>
</ul>
<p>특히 <strong>현대자동차그룹</strong>이 보유한 방대한 차량 데이터와 <strong>현대오토에버</strong>의 소프트웨어 역량을 바탕으로 API·SDK 중심의 생태계를 구축하고 있다는 점에서 의미가 큽니다.</p>
<blockquote>
<p>향후 <strong>자율주행, 스마트시티, 로보틱스</strong>가 본격화될수록 <strong>위치 데이터 플랫폼의 중요성</strong>은 더욱 커질 것이며
<strong>routo</strong> 역시 <strong>미래 모빌리티</strong>를 지탱하는 <strong>핵심 인프라</strong> 중 하나로 성장할 것으로 기대됩니다.</p>
</blockquote>
<p>이상으로 모빌리티 산업 이슈 스터디 세번째 포스팅을 마치도록 하겠습니다.</p>
<p>더 많은 모빌리티 이야기가 궁금하시면 하단의 H 모빌리티 클래스 공식 인스타그램을 확인해주세요!</p>
<p>&quot;최적의 결정을 설계하는 자율주행 판단 전문가 남서현 앰버서더&quot; 였습니다!
<img src="https://velog.velcdn.com/images/seohyun_nam/post/acf8ddc6-aebc-42ac-86cf-92508b8c5840/image.jpg" alt=""></p>
<p>#H-모빌리티 클래스 #H-모빌리티 클래스 앰버서더 #대외활동 #현대자동차 #현대오토에버 #routo #차량 데이터 플랫폼 #자율주행 #정밀지도 #HD Map #API</p>
<h3 id="reference">Reference</h3>
<p><a href="https://www.hyundaimotorgroup.com/ko/story/hyundai-autoever-routo-b2b-mobility-data-platform">https://www.hyundaimotorgroup.com/ko/story/hyundai-autoever-routo-b2b-mobility-data-platform</a>
<a href="https://www.hyundai-autoever.com/kor/about/pr/blog/list.do">https://www.hyundai-autoever.com/kor/about/pr/blog/list.do</a>
<a href="https://www.hyundai-autoever.com/kor/business-area/core-technology/bigdata/contents.do?cntnSeq=361">https://www.hyundai-autoever.com/kor/business-area/core-technology/bigdata/contents.do?cntnSeq=361</a>
<a href="https://www.routo.com/developers/rest_api/document.html#_%EC%84%A0%ED%98%95_%EA%B1%B0%EB%A6%AC_%EA%B3%84%EC%82%B0">https://www.routo.com/developers/rest_api/document.html#_%EC%84%A0%ED%98%95_%EA%B1%B0%EB%A6%AC_%EA%B3%84%EC%82%B0</a>
<a href="https://demo.routo.com/search?m=16.56,0,55,0,3hta,ko">https://demo.routo.com/search?m=16.56,0,55,0,3hta,ko</a>
<a href="https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D">https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[42dot 자율주행 통합 모빌리티 플랫폼: TAP!]]></title>
            <link>https://velog.io/@seohyun_nam/42dot-%EC%9E%90%EC%9C%A8%EC%A3%BC%ED%96%89-%ED%86%B5%ED%95%A9-%EB%AA%A8%EB%B9%8C%EB%A6%AC%ED%8B%B0-%ED%94%8C%EB%9E%AB%ED%8F%BC-TAP</link>
            <guid>https://velog.io/@seohyun_nam/42dot-%EC%9E%90%EC%9C%A8%EC%A3%BC%ED%96%89-%ED%86%B5%ED%95%A9-%EB%AA%A8%EB%B9%8C%EB%A6%AC%ED%8B%B0-%ED%94%8C%EB%9E%AB%ED%8F%BC-TAP</guid>
            <pubDate>Wed, 20 May 2026 02:40:08 GMT</pubDate>
            <description><![CDATA[<p>안녕하세요!</p>
<p>오늘은 누구나 쉽게 자율주행차를 호출하고 탑승할 수 있는 TAP!, <strong>42dot의 자율주행 모빌리티 서비스</strong>에 대한 <strong>2번째 모빌리티 산업 이슈 케이스 스터디</strong>를 진행했습니다.</p>
<h2 id="42dot-포티투닷">42dot (포티투닷)</h2>
<blockquote>
<ol>
<li>TaaS(Transportation as a Service) 기반의 <strong>자율주행 소프트웨어 및 모빌리티</strong> 플랫폼 기업</li>
<li>사람과 물류의 효율적인 이동을 위한 통합 모빌리티 서비스 개발</li>
</ol>
</blockquote>
<h3 id="주요-사업-분야">주요 사업 분야</h3>
<blockquote>
<p><strong>자율주행 기술</strong> 개발
자동배달로봇 및 드론
<strong>차량 공유(Car Sharing)</strong> 및 <strong>차량 호출(Ride Hailing)</strong>
스마트 물류 서비스</p>
</blockquote>
<h3 id="핵심-기술">핵심 기술</h3>
<blockquote>
<p><strong>카메라, 레이더, GNSS를 통합한 AI 기반 자율주행 시스템</strong>
<strong>주변 환경, 차량 간 거리, 속도</strong> 등을 실시간으로 예측
고정밀 지도(HD Map) 대신 <strong>경량화 지도를 활용한 레벨4 자율주행 기술</strong> 보유</p>
</blockquote>
<h3 id="플랫폼-서비스">플랫폼 서비스</h3>
<blockquote>
<p><strong>TAP! 자율주행 운송 플랫폼</strong> 운영
자사 차량뿐 아니라 타사 자율주행 차량까지 호출 및 배차 가능한 통합 플랫폼 제공</p>
</blockquote>
<h2 id="tap-이란">TAP 이란?</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/f22524d9-229a-4c46-bb1a-d5ef7a5ff5e1/image.jpg" alt=""></p>
<p>여러 지역에서 이용하는 다양한 자율주행차 <strong>2022년 2월, 서울시 상암동을 시작</strong>으로 <strong>청계천, 청와대, 여의도 국회, 용인</strong> 모빌리티 뮤지엄까지 많은 분들이 자율주행차를 이용할 수 있도록 서비스 지역을 확대하고 있습니다.</p>
<p>42dot의 자율주행 솔루션이 탑재된 자율주행차는 스스로 인지, 판단, 제어가 가능하여, 다양한 도시 환경 속에서도 안전하고 편안한 자율주행을 경험할 수 있습니다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/008809ea-b1e8-4af7-bee0-0da2b3005d9a/image.jpg" alt=""></p>
<h3 id="안전하고-편안한-자율주행-경험">안전하고 편안한 자율주행 경험</h3>
<p>42dot의 자율주행 솔루션이 탑재된 자율주행차는 스스로 <strong>인지, 판단, 제어가 가능</strong>하여, 다양한 도시 환경 속에서도 안전하고 편안한 자율주행을 경험할 수 있습니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/600f2284-76f1-419d-b241-20f1ec303fa7/image.jpg" alt=""></p>
<h3 id="ai와-데이터에-기반한-배차와-경로-안내">AI와 데이터에 기반한 배차와 경로 안내</h3>
<p><strong>실시간 교통 상황 분석, 고도화된 최적화 경로 추천, AI 기반 매칭 기술</strong>로 자율주행차를 배차 받고, 목적지까지 빠르고 안전하게 이동할 수 있습니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/9bd766ff-95a3-4e1c-a24c-2a47ed69b48e/image.jpg" alt=""></p>
<h3 id="이동-그-이상의-즐거움">이동 그 이상의 즐거움</h3>
<p>차량 내 설치된 <strong>RSI (rear-seat infotainment)는 새로운 이동 경험을 제공</strong>합니다. <strong>실시간 운행 정보(시간, 경로, FAQ)</strong> 뿐만 아니라 엔터테인먼트, AI 서비스로 사용자와 인터랙션을 강화하여 이동이 즐거워집니다.</p>
<h3 id="안전을-지원하는-세이프티-드라이버">안전을 지원하는 세이프티 드라이버</h3>
<p>세이프티 드라이버는 도로와 승객의 각종 <strong>돌발 상황에 대처</strong>합니다. 또한 어린이 보호구역과 같이 필요시, 수동운전을 지원하며 안전한 서비스를 제공합니다.</p>
<p>이상으로 모빌리티 산업 이슈 스터디 두번째 포스팅을 마치도록 하겠습니다.</p>
<p>더 많은 모빌리티 이야기가 궁금하시면 하단의 H 모빌리티 클래스 공식 인스타그램을 확인해주세요!</p>
<p>&quot;최적의 결정을 설계하는 자율주행 판단 전문가 남서현 앰버서더&quot; 였습니다!</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/ccfacc9b-8f0c-40d5-bdb7-4b83c65bdc38/image.jpg" alt=""></p>
<p>#H-모빌리티 클래스 #H-모빌리티 클래스 앰버서더 #대외활동 #현대자동차 #42dot #포티투닷 #자율주행 #TAP #SDV #TaaS </p>
<h3 id="reference">Reference</h3>
<p><a href="https://www.42dot.ai/mobility/tap/about">https://www.42dot.ai/mobility/tap/about</a>
<a href="https://www.hyundaimotorgroup.com/ko/tag/42dot">https://www.hyundaimotorgroup.com/ko/tag/42dot</a>
<a href="https://www.youtube.com/watch?v=lcbCHODJ0X4&amp;t=231s">https://www.youtube.com/watch?v=lcbCHODJ0X4&amp;t=231s</a>
<a href="https://www.youtube.com/watch?v=hUmtUgMtfw8&amp;t=2s">https://www.youtube.com/watch?v=hUmtUgMtfw8&amp;t=2s</a>
<a href="https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D">https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Pleos Connect: 새로운 이동 경험을 만드는 차세대 인포테인먼트 시스템]]></title>
            <link>https://velog.io/@seohyun_nam/Pleos-Connect-%EC%83%88%EB%A1%9C%EC%9A%B4-%EC%9D%B4%EB%8F%99-%EA%B2%BD%ED%97%98%EC%9D%84-%EB%A7%8C%EB%93%9C%EB%8A%94-%EC%B0%A8%EC%84%B8%EB%8C%80-%EC%9D%B8%ED%8F%AC%ED%85%8C%EC%9D%B8%EB%A8%BC%ED%8A%B8-%EC%8B%9C%EC%8A%A4%ED%85%9C</link>
            <guid>https://velog.io/@seohyun_nam/Pleos-Connect-%EC%83%88%EB%A1%9C%EC%9A%B4-%EC%9D%B4%EB%8F%99-%EA%B2%BD%ED%97%98%EC%9D%84-%EB%A7%8C%EB%93%9C%EB%8A%94-%EC%B0%A8%EC%84%B8%EB%8C%80-%EC%9D%B8%ED%8F%AC%ED%85%8C%EC%9D%B8%EB%A8%BC%ED%8A%B8-%EC%8B%9C%EC%8A%A4%ED%85%9C</guid>
            <pubDate>Tue, 12 May 2026 02:51:34 GMT</pubDate>
            <description><![CDATA[<p>오늘은 H-모빌리티 클래스 앰버서더 활동의 일환으로 &quot;<strong>Pleos Connect</strong>&quot;에 대한 <strong>모빌리티 산업 이슈 케이스 스터디</strong>를 진행했습니다. </p>
<h2 id="pleos-connect">Pleos Connect</h2>
<blockquote>
<p>2025년 현대차그룹이 개발자 컨퍼런스인 ‘Pleos 25’를 통해 공개한 연구개발 버전의 양산 모델로, 향후 소프트웨어 기반 차량(SDV)의 기반이 될 <strong>차세대 인포테인먼트 시스템</strong></p>
</blockquote>
<h3 id="특징">특징</h3>
<ul>
<li><strong>직관성, 안전성, 개방성</strong> 3대 핵심 가치 지향</li>
<li>대화면 디스플레이</li>
<li>슬림 디스플레이 </li>
<li>AI 기반 음성 어시스턴트 ‘Gleo AI&#39; 탑재 </li>
<li>개방형 앱 마켓 등을 적용해 차량을 스마트폰처럼 작동</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/84283518-53e7-4a1f-a768-0d9bee4a4eac/image.jpg" alt=""></p>
<h3 id="장점">장점</h3>
<blockquote>
<ul>
<li>태블릿 형식의 디스플레이 위에 스마트폰과 유사한 UI가 적용돼 직관성을 높임</li>
</ul>
</blockquote>
<ul>
<li><strong>Multi-Window 기능</strong>을 통해 사용자가 한 화면에서 여러 애플리케이션을 동시에 사용 가능 </li>
<li><strong>Split View 기능을 제공</strong>해 스마트폰을 다루듯 화면을 조작하면 화면 구성 및 위치를 쉽게 바꿀 수 있음</li>
<li>사용자가 원하는 대로 화면과 정보를 구성할 수 있어 한층 몰입감 있는 차량 인포테인먼트 환경을 경험 가능</li>
<li>개인이 보유한 스마트폰과 완벽히 연동가능</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/9a93886f-0872-4cf5-9438-aa72d7ffa73c/image.jpg" alt=""></p>
<h2 id="navigation-system">Navigation System</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/0737210e-55de-4b4b-9b69-99cddf1ee92b/image.jpg" alt=""></p>
<p>현대차그룹은 운전자가 더 쉽고 안전하게 내비게이션을 사용할 수 있도록 UX를 개선했습니다. 사용 빈도가 높은 기능 중심으로 화면과 메뉴를 단순화하고, 시인성을 높여 직관적인 사용이 가능하도록 설계했고, 모듈형 인터페이스를 적용해 운전자가 화면을 자유롭게 구성하고 여러 앱을 동시에 사용할 수 있게 했습니다.</p>
<p><strong>실시간 차량 데이터</strong>를 기반으로 정확한 길 안내를 제공하며, <strong>AI 에이전트 기능</strong>을 통해 음성 명령으로 주차 정보나 주변 맛집 정보를 확인하고 경로를 재설정할 수 있습니다. 앞으로는 실외 주차장 정보 제공, 전기차 주행 가능 거리 예측 등 다양한 기능을 추가해 고객 편의를 높일 계획입니다.</p>
<h2 id="gleo-ai">Gleo AI</h2>
<blockquote>
<p>초거대 언어모델(<strong>LLM</strong>) 기반의 생성형 인공지능</p>
</blockquote>
<p>Gleo AI는 <strong>사용자의 발화에서 맥락을 인식</strong>해 목적지 설정, 공조 제어, 음악 재생 등 <strong>복합적인 요청도 한 번에 처리</strong>하며, 날씨와 교통정보 등 다양한 정보에 대한 질문에도 자연스럽게 응답할 수 있습니다. 좌석별로 개인화된 명령을 구분할 수 있습니다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/a529a57a-a1f2-4252-b7ac-cd52288503ee/image.jpg" alt=""></p>
<p>직전의 대화 이력을 분석해 ‘거기’, ‘이 근처’와 같은 <strong>추상적인 표현도 정확히 이해</strong>할 수 있고, 완벽하지 않은 문장이나 다양한 지역의 사투리로 말해도 <strong>어투의 의도를 파악</strong>하고 대화할 수 있습니다.</p>
<p>동시에 여러 가지를 명령했을 때 이를 인식하고 <strong>순차적으로 처리하는 멀티 명령어 수행도 가능</strong>합니다.
웹 검색을 통해 날씨 및 생활 정보, 스포츠 경기 결과, 일반 상식, 최신 뉴스 등에 관한 사용자의 질문에 검색을 통해 답을 해주는 것은 물론, AI를 통해 상황에 맞는 대답을 해줌으로써 운전자와 다양한 주제로 대화를 나눌 수 있습니다.</p>
<p>여러 가지 명령어를 다 들어주는 능력을 가진 Gleo AI는 <strong>음성인식으로 차량 내 다양한 기능을 제어</strong>하는데, 이를 통해 주행 중 필요한 내비게이션 목적지 설정, 공조 설정 등 차량 전반을 컨트롤할 수 있습니다.</p>
<p>예를들어, 운전석이나 동승석이 아닌 뒷자리에 탑승한 사람이 Gleo AI에게 열선을 켜달라고 말하면 위치를 말하지 않아도 뒷좌석 마이크를 통해 말한 사람의 위치를 파악해 그 자리 열선기능을 켜줍니다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/d0d1f2ec-7084-4d33-9697-87f7a41d6830/image.jpg" alt=""></p>
<p>Pleos Connect는 ‘<strong>Pleos ID</strong>’를 기반으로 한 초개인화 서비스도 제공합니다. Pleos Connect가 탑재된 차량에서 사용자가 Pleos ID로 로그인하면, 차종이나 차량과 관계없이 자신의 설정과 연결된 프로필 정보를 바탕으로 <strong>일관된 사용자 경험</strong>을 누릴 수 있습니다. </p>
<h2 id="pleos-playground">Pleos Playground</h2>
<blockquote>
<p>현대차그룹은 <strong>개방형 소프트웨어 개발 플랫폼</strong> ‘Pleos Playground’를 구축하고, ‘Pleos App Market’을 운영해 <strong>차량용 앱 생태계의 확장과 혁신을 주도</strong>하고자 합니다. </p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/9f8072ff-c169-45ef-b6e5-7dacb2a851e5/image.jpg" alt=""></p>
<p>스마트폰에 사용자가 원하는 앱을 자유롭게 설치해 사용하고, 필요에 따라 업데이트 및 삭제하는 것과 동일한 과정이 Pleos Connect에서 구현될 수 있습니다. Pleos Connect의 확장성은 모바일 환경처럼 다양한 외부 앱이 연결됐을 때 비로소 가치를 발휘하게 됩니다. </p>
<blockquote>
<p><strong><em>기대효과:</em></strong> <strong><em>기존에 제조사와 공급업체만 접근할 수 있었던 차량, 클라우드, 데이터 분석, 액세서리 등 모든 차량용 소프트웨어 개발 환경을 개방해 누구든 차량용 앱을 자유롭게 개발할 수 있는 환경을 조성</em></strong> </p>
</blockquote>
<p>이처럼 환경의 제약 없이 완성된 앱들은 Pleos Connect의 앱 마켓에 등록돼 SDV 앱 생태계의 확장에 기여하게 됩니다. 이로써 현대차그룹 고객은 <strong>일상과 모바일, 차 안에서의 환경이 끊김없이 이어지는 확장된 모빌리티 라이프를 경험</strong>할 수 있게 됩니다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/92224d9a-bc1f-47bd-b8a2-416fe28d08f4/image.jpg" alt=""></p>
<p>Pleos 플랫폼을 기반으로 연결된 <strong>모빌리티 디바이스와 서비스, FMS(Fleet Management System, 차량 관제 시스템), TMS(Transportation Management System, 운송 관리 시스템), DRT(수요응답형 대중교통)</strong> 모빌리티 등 미래 이동 생태계를 구현할 다양한 솔루션의 모습을 확인할 수 있습니다.</p>
<p>교통 약자를 위해 휠체어를 쉽게 실을 수 있는 <strong>WAV(Wheelchair Accessible Vehicle) 모델, 교통 약자도 간편하게 조작할 수 있는 퍼스널 모빌리티, 그리고 현대차 ST1을 기반으로 DRT에 맞게 개조한 차량</strong> 등 모두의 자유로운 이동을 위해 개발된 여러 모빌리티 디바이스를 직접 보고 미래 도심의 풍경을 상상할 수 있습니다.</p>
<p>이상으로 모빌리티 산업 이슈 스터디 포스팅을 마치도록 하겠습니다.</p>
<p>더 많은 모빌리티 이야기가 궁금하시면 하단의 <strong>H 모빌리티 클래스 공식 인스타그램</strong>을 확인해주세요!</p>
<p>&quot;최적의 결정을 설계하는 자율주행 판단 전문가 남서현 앰버서더&quot; 였습니다!</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/c7f64bfa-0020-4d3b-9e2c-29c05292d662/image.jpg" alt=""></p>
<p>#H-모빌리티 클래스 #H-모빌리티 클래스 앰버서더 #대외활동 #현대자동차 #네비게이션 #최적경로 #Gloe AI #SDV #Pleos Connect #자율주행 </p>
<h3 id="reference">Reference</h3>
<p><a href="https://www.hyundaimotorgroup.com/ko/tv/gleo-ai-core-features-vehicle-conversation">https://www.hyundaimotorgroup.com/ko/tv/gleo-ai-core-features-vehicle-conversation</a>
<a href="https://www.hyundaimotorgroup.com/ko/story/CONT0000000000204964">https://www.hyundaimotorgroup.com/ko/story/CONT0000000000204964</a>
<a href="https://www.hyundaimotorgroup.com/ko/story/CONT0000000000173173">https://www.hyundaimotorgroup.com/ko/story/CONT0000000000173173</a>
<a href="https://www.hyundaimotorgroup.com/ko/tag/42dot">https://www.hyundaimotorgroup.com/ko/tag/42dot</a>
<a href="https://www.youtube.com/watch?v=bCB_sk-bsFo">https://www.youtube.com/watch?v=bCB_sk-bsFo</a>
<a href="https://www.youtube.com/shorts/Ohr1hCAx8k0">https://www.youtube.com/shorts/Ohr1hCAx8k0</a>
<a href="https://www.cartvnews.com/news/articleView.html?idxno=701276">https://www.cartvnews.com/news/articleView.html?idxno=701276</a>
<a href="https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D">https://www.instagram.com/h_mobility_class?utm_source=ig_web_button_share_sheet&amp;igsh=ZDNlZDc0MzIxNw%3D%3D</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[[2026 H-모빌리티 클래스] ]]></title>
            <link>https://velog.io/@seohyun_nam/2026-H-%EB%AA%A8%EB%B9%8C%EB%A6%AC%ED%8B%B0-%ED%81%B4%EB%9E%98%EC%8A%A4</link>
            <guid>https://velog.io/@seohyun_nam/2026-H-%EB%AA%A8%EB%B9%8C%EB%A6%AC%ED%8B%B0-%ED%81%B4%EB%9E%98%EC%8A%A4</guid>
            <pubDate>Sun, 19 Apr 2026 08:29:20 GMT</pubDate>
            <description><![CDATA[<blockquote>
<p>교육생 모집글에 의하면, <strong>H-모빌리티 클래스</strong>는 로보틱스, 자율주행, 전동화, 에너지솔루션, 파워트레인에 대한 교육 기회를 제공하는 <strong>현대자동차 연구소 주관 역량 향상 프로그램</strong>이다.</p>
</blockquote>
<blockquote>
<p>빠르게 변화하는 모빌리티 미래기술을 대학생 및 대학원생들에게 전파하고 이해도를 향상시킴으로써 청년들의 취업 경쟁력 향상을 지원한다 </p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/a4b9ee36-ec6f-404a-ac60-9e16cb210e00/image.jpg" alt=""></p>
<h2 id="2026-h-모빌리티-클래스-합격-후기">2026 H-모빌리티 클래스 합격 후기</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/36e8547a-ba9e-4786-aedd-ffef449c2e70/image.jpg" alt=""></p>
<h4 id="1-전동화">1. 전동화</h4>
<blockquote>
<p>#모터 #전력변환</p>
</blockquote>
<h4 id="2-에너지-솔루션">2. 에너지 솔루션</h4>
<blockquote>
<p>#연료전지 #배터리</p>
</blockquote>
<h4 id="3-자율주행">3. 자율주행</h4>
<blockquote>
<p>#인지 #판단 #제어
#통신 및 네트워크 #임베디드SW</p>
</blockquote>
<h4 id="4-파워트레인">4. 파워트레인</h4>
<blockquote>
<p>#엔진 #변속기 #HEV #EREV</p>
</blockquote>
<h4 id="5-로보틱스">5. 로보틱스</h4>
<blockquote>
<p>#소프트웨어 플랫폼 #기구학 · 역기구학 및 동작계획 #제어 및 동역학 #인지 · 센서 · 상태추정</p>
</blockquote>
<h3 id="자기소개서-작성">자기소개서 작성</h3>
<blockquote>
<p>Q1. 신청 이유와 이를 통해 얻고자 하는 목표 (최대 500자)
Q2. 자기주도적 학습을 통해 성과를 만들었던 경험 (최대 500자)</p>
</blockquote>
<p>이번 2026년 모집에서 자기소개서 문항은 2개였다. 나는 5개의 트랙중에 자율주행 판단 트랙에 지원하였고, 모빌리티에 관련해서 과거에 진행했었던 프로젝트 경험과 국제학술대회 논문 게재를 위해 스스로 모르는 부분에 대해서 지속적으로 찾아보고 꾸준히 공부했었던 경험을 자소서에 잘 녹여내려고 노력했는데, 이를 좋게 평가해주셔서 운이 좋게 합격했다고 생각한다. </p>
<h2 id="h-mobility-class란">H-mobility class란?</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/35734e86-405a-4288-a2d3-b5329339f980/image.jpg" alt=""></p>
<h2 id="h-모빌리티-클래스-기본-및-심화-교육-일정">H-모빌리티 클래스 기본 및 심화 교육 일정</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/ffb52fe4-2c97-43ab-b045-ad9c5ab60f99/image.jpg" alt=""></p>
<p>2026년 4월 20일부터 2026년 6월 26일까지 온라인 콘텐츠 수강을 통해 기본 교육이 진행된다.
여러 기준을 통해 심화교육이 선정되고 7월 20일부터 8월 14일 중 최대 6일 동안 온라인/오프라인 심화교육이 이루어 지게 된다. </p>
<p>나의 단기 목표는 기본교육을 성실히 이수해서 우수한 성적을 받아 심화교육 대상자로 선정되는 것이다. 따라서 앞으로 꾸준히 온라인 교육을 수강하면서 교육 내용들을 포스팅하고 공부한 내용들을 기록해갈 예정이다. 더불어 내가 H-mobility class 앰버서더에 지원을 하게된 계기도 이 교육 프로그램에 애착과 관심을 갖고 무사히 잘 수료하고 싶은 바람이 있었기 때문이기도 하다. </p>
<p>기본교육 입교자들을 위한 웰컴키트도 배송될 예정이고 4월 20일부터 교육이 본격적으로 시작되어 매우 설레고 기쁘다. 평소에 자율주행 영역에 대해서 관심이 많고 궁금한 부분들이 상당히 많았는데 이번 교육 프로그램으로 인해 좋은 기회를 받게 된것 같아 한편으로는 H 모빌리티 클래스 운영자분들께 감사드린다. </p>
<p>이 교육 프로그램이 앞으로 나의 커리어에 있어서 특히 모빌리티 분야에 대한 첫걸음이자 훌륭한 이정표가 되어 줄 것 같다. 마지막까지 유종의 미를 거두기 위해 최선을 다해보려고 한다.</p>
<p>지금까지 &quot;최적의 결정을 설계하는 자율주행 판단 전문가&quot; 자율주행 판단 트랙 앰버서더 남서현
이였습니다!
<img src="https://velog.velcdn.com/images/seohyun_nam/post/a0f98c24-c9a3-4d89-b126-75fc3267865a/image.jpg" alt=""></p>
<p>감사합니다.</p>
<p>#H모빌리티클래스, #H모클앰버서더, #현대자동차, #H_mobility_class</p>
<h3 id="reference">Reference</h3>
<p><a href="https://h-mobility-class.com/">https://h-mobility-class.com/</a>
<a href="https://blog.naver.com/h-mobility-class">https://blog.naver.com/h-mobility-class</a>
<a href="https://www.hyundai-ngv.com/main/index.jsp">https://www.hyundai-ngv.com/main/index.jsp</a>
<a href="https://www.instagram.com/h_mobility_class/">https://www.instagram.com/h_mobility_class/</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[쉽게 이해하는 온톨로지 실무]]></title>
            <link>https://velog.io/@seohyun_nam/%EC%89%BD%EA%B2%8C-%EC%9D%B4%ED%95%B4%ED%95%98%EB%8A%94-%EC%98%A8%ED%86%A8%EB%A1%9C%EC%A7%80-%EC%8B%A4%EB%AC%B4</link>
            <guid>https://velog.io/@seohyun_nam/%EC%89%BD%EA%B2%8C-%EC%9D%B4%ED%95%B4%ED%95%98%EB%8A%94-%EC%98%A8%ED%86%A8%EB%A1%9C%EC%A7%80-%EC%8B%A4%EB%AC%B4</guid>
            <pubDate>Sun, 05 Apr 2026 15:24:33 GMT</pubDate>
            <description><![CDATA[<h2 id="지그재그-세미나-4회">지그재그 세미나 4회</h2>
<blockquote>
<p>주제: 쉽게 이해하는 온톨로지 기술 실무 (그래프 모델의 선택과 온톨로지 구축 전략)
일시: 2026년 3월 11일 (수) 오후 7시
장소: GS타워 25층 (역삼역 인근) 오픈이노베이션 오픈홀</p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/757a44e4-5b79-4fd1-b197-7e0a0d83479d/image.jpg" alt=""></p>
<p><em><strong>먼저, 우리는 왜 온톨로지를 구축하려고 하는것인가?</strong></em></p>
<p>우리는 현재 저장의 시대에서 탐색, 연결, 해석, 재사용의 시대로 데이터의 주요 소비자와 환경이 변화하였다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/8339bb4b-f646-45fe-860b-0e28703d29a6/image.jpg" alt=""></p>
<blockquote>
<p><em>&gt; 현재 우리가 겪는 가장 큰 어려움은 &quot;<del>데이터 양의 부족</del>&quot;이 아니라 여러 시스템과 문서에 흩어진 &quot;<strong>같은 대상</strong>&quot;을 &quot;<strong>서로 다른 이름과 구조</strong>&quot;로 표현하고 있는 것이 가장 큰 장애물 이라는 의미이다.</em></p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/2f662f32-3817-443c-8d6e-c3d1a9ffc3ad/image.jpg" alt=""></p>
<p>고유한 맥락과 의미구조에 대한 보장/ 검증이 되는가? 
따라서 우리는 단순 검색을 넘어 개체 간 관계를 따라가며 여러 단계를거쳐 답을 도출하는 과정에서 무엇이 무엇과 연결되고, 어떤 제약과 규칙 아래에 있으며, 무엇을 근거로 실행해야 하는지를 판단해야 한다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/0af0bf0e-cbc9-4987-b9aa-92ad552348a1/image.jpg" alt=""></p>
<p>즉, 우리는 데이터와 지식을 묶는 공통의 언어가 필요하다.</p>
<p><em><strong>--&gt; 온톨로지 구축은 있으면 좋은 지식표현 기술, 단순 RDF/OWL 문서를 AI, 데이터, 통합, 자동화를 동시에 성립시키는 기반이 되며, 사람과 AI가 대상 세계를 온전하게 이해하게 만드는 확실한 방법이다.</strong></em> </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/55524ab1-03a0-4904-8136-a70160446f87/image.jpg" alt=""></p>
<h2 id="1-시멘틱-웹과-온톨로지">1. 시멘틱 웹과 온톨로지</h2>
<ul>
<li>RDF/RDFS/OWL, 지식그래프, Property Graph</li>
</ul>
<h3 id="semantic-web의-개념">Semantic Web의 개념</h3>
<p>&quot;의미를 이해하는 웹&quot;
웹이 인간의 두뇌를 닮기 위해서는 정보를 단지 축적하거나 연결하는 것만이 아닌, 그 의미까지 이해하고 기계가 처리할 수 있어야 한다. </p>
<p>Tim Berners-Lee : WWW의 창시자로서, 인터넷 상의 하이퍼미디어를 넘어 데이터의 의미까지 기계가 이해하고 처리할 수 있는 형태로 확장한 &#39;시멘틱 웹&#39; 개념과 아키택처를 제안함</p>
<ul>
<li><h4 id="기존-웹-web-of-documents">기존 웹 (Web of Documents)</h4>
<p>문서(Web page) 중심의 분산 네트워크, URL(Uniform Resource Locator)를 사용해 문서의 &#39;위치&#39;를 참조하고 하이퍼링크로 연결</p>
</li>
<li><h4 id="시멘틱-웹-web-of-data">시멘틱 웹 (Web of Data)</h4>
<p>데이터(Data) 차원의 분산 네트워크, URI (Uniform Resource identifier)를 사용해 데이터/엔티티 자체를 전역적으로 식별하고 연결</p>
</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/cd940297-76ee-4042-9478-94f98e5e4784/image.jpg" alt=""></p>
<ul>
<li><h4 id="계층적-구조-layered-cake">계층적 구조 (Layered Cake)</h4>
팀 버너스 리가 제안한 웹 아키텍처로, 하위 계층은 상위 계층을 위한 기반을 제공한다. 위로 올라갈수록 데이터의 의미(Semantics)와 추론 능력이 강화된다.</li>
</ul>
<h3 id="rdf-resource-description-framework">RDF (Resource Description Framework)</h3>
<ul>
<li>웹 자원 기술의 표준, 웹상에 존재하는 자원의 속성과 관계를 기술하기 위한 W3C 표준 데이터 모델</li>
<li>트리플 (Triple) 구조: 모든 정보는 주어 (Subject) - 서술어 (Predicate) - 목적어 (Object)의 3요소 (Triple) 형태로 표현됨</li>
<li>기계 해석 가능성: 그래프 구조로 연결된 데이터는 기계가 그 의미와 맥락을 파악하고 자동으로 처리/추론 할 수 있게함
<img src="https://velog.velcdn.com/images/seohyun_nam/post/872d2fe6-018c-4243-942e-2ceb747996d3/image.jpg" alt=""></li>
</ul>
<p>RDF의 주요 구성 요소: 자원의 식별(Identifier), 값의 표현(Literal), 데이터셋 관리(Graphs)</p>
<h4 id="식별자-identifiers">식별자 (Identifiers)</h4>
<ul>
<li><p>URI (Uniform Resource Identifier) 
웹상의 자원을 고유하게 식별하는 전역 식별자, UR의 개념을 확장하여, 문서 뿐만이 아니라 개념, 사물 등 모든 엔티티를 유일하게 지칭함, 다른 시스템에서도 동일한 대상을 식별/재사용 가능</p>
</li>
<li><p>Compact URI (CURIE)
긴 URI를 효율적으로 표현하기 위해 Name Space(접두어)를 사용하여 축약한 형태</p>
</li>
</ul>
<h4 id="값과-그래프-values--structure">값과 그래프 (Values &amp; Structure)</h4>
<ul>
<li><p>Literal (리터럴)
자원의 속성 값(문자열, 숫자, 날짜 등)을 표현, 오직 Object(목적어) 위치에만 등장 가능</p>
</li>
<li><p>Multiple Graphs
여러개의 RDF 그래프를 하나의 데이터셋으로 관리, 출처(Provenance), 접근제어, 메타데이터 관리를 위해 사용 ex) Default graph: 이름 없는 기본 그래프, Named graph: IRI로 식별되는 그래프 (Quad 구조)</p>
</li>
</ul>
<h3 id="rdf-표현">RDF 표현</h3>
<p>기계와 사람이 읽을 수 있는 다양한 표현 방식</p>
<blockquote>
<p>Turtle (Terse RDF Triple language): 가장널리 사용되는 인간 친화적 포맷, 중복을 줄이고 가독성을 높인 문법
N-Triples: 가장 단순한 형태, 한줄에 하나의 트리플을 온전한 URI로 표현, 파싱이 매우 빠름
JSON-LD: JSON 기반의 Linked Data 포맷, 웹 개발자에게 친숙하면 API 응답용으로 주로 사용
RDF/XML: 초기 표준 형식, XML의 복잡성으로 인해 현재는 가독성이 좋은 Trutle 등을 선호</p>
</blockquote>
<h3 id="rdfs-rdf-schema">RDFS (RDF Schema)</h3>
<p>어휘의 의미와 상하위 관계를 정의하는 시맨틱 웹의 분류체계</p>
<ul>
<li><p>어휘 및 의미정의
단순 데이터 연결을 넘어, Class(개념)와 Property(속성)를 정의하여 데이터가 어떤 의미를 갖는지 기계에게 설명하는 사전역할을 함</p>
</li>
<li><p>분류 체계 (Taxonomy)
subClassOf(하위 클래스)와 subPropertyOf(하위 속성)를 사용하여 개념 간의 계층 구조와 상속 관계를 형성</p>
</li>
<li><p>관계의 제약 조건
속성이 연결돌 수 있는 주어의 타입(Domain)과 목적어의 타입(Range)를 지정하여 논리적 무결성을 보장하고 추론의 근거를 제공</p>
</li>
<li><p>RDFS 추론 메커니즘
스키마 정보 (Domain, Range, SubClass)를 기반으로 새로운 사실을 도출하는 과정</p>
</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/47f00ce7-1c2e-4388-a2b7-041d1c9db9c0/image.jpg" alt=""></p>
<h3 id="owl">OWL</h3>
<p>Web Ontology Language, 지식표현을 위한 상위 논리 모델링 계층</p>
<ul>
<li><p>Description Logic 기반
RDFS 위에서 동작하며, 서술논리를 기반으로 하여 사물간의 복잡하고 풍부한 관계를 명확하게 정의하고 추론(Resoning)할 수 있는 언어</p>
</li>
<li><p>향상된 표현력
단순 계층 구조를 넘어 집합 연산(교집합, 합집합), 카디널리티(개수 제한), 속성 특성(대칭, 전이, 역관계) 등 정교한 제약조건을 표현할 수 있음</p>
</li>
<li><p>OWL 버전과 Profile
2004년 OWL에 이어 2009년 OWL2가 발표되었으며, 사용 목적과 연산 복잡도에 따라 EL, QL, RL 등 다양한 profile을 제공함</p>
</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/5e9ad68b-1523-494c-b2c5-ac858f37fb4e/image.jpg" alt=""></p>
<h3 id="what-is-ontology">What is Ontology?</h3>
<p>지식 표현을 위한 인공물로서의 온톨로지 개념</p>
<blockquote>
<p><em>&quot;An ontology is an explicit and formal specification of a shared conceptualization of a domain of interest&quot;</em> - Tom Gruber (1993)</p>
</blockquote>
<ul>
<li>철학(존재론): &#39;존재의 본질&#39;을 탐구하며 세상에 무엇이 존재하는가를 다룸</li>
<li>정보기술(IT): 특정 도메인의 지식 공유와 재사용을 위한 &#39;설계된 인공물(Artifact)&#39;</li>
<li>철학적 뿌리를 가지지만, IT에서는 기계가 처리가 가능한 명세에 초점</li>
</ul>
<h3 id="온톨로지의-구성요소">온톨로지의 구성요소</h3>
<p>지식 표현을 위한 구성 요소</p>
<ul>
<li>개념 (Concept): 특정 영역의 사물이나 현상에 대한 추상적 분류 (Class)</li>
<li>인스턴스: 개념에 속하는 구체적인 개별 실체 (Individual)</li>
<li>속성 (Property): 개념이 가지는 특성이나 데이터 값 (Attribute)</li>
<li>관계: 개념간의 상호작용 및 연결 구조 (Relation)</li>
<li>공리 (Axiom): 증명없이 참으로 간주되는 논리적 규칙</li>
<li>제약조건: 속성 값이나 관계에 대한 논리적 제한</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/c71e36c8-9b61-461d-9907-cbdd9d6fb136/image.jpg" alt=""></p>
<h3 id="knowledge-graph">Knowledge Graph</h3>
<p>의미모델과 데이터가 결합된 지식표현구조</p>
<ul>
<li>스키마와 데이터의 결합: 단순한 node와 edge의 연결이 아니라, 도메인의 개념적 정의인 스키마(Schema/Ontology)와 그 정의에 기반한 실제 데이터(Instance)가 결합된 결과물</li>
<li>의미 기반 추론 가능: 의미(Semantics)의 공유와 일관성을 보장하며, 정의된 관계와 규칙을 바탕으로 새로운 사실을 도출하는 추론(Resoning) 및 탐색이 가능</li>
<li>구성의 필수 요소: 지식그래프는 스키마(필수)와 데이터(필수)가 모두 존재해야 하며, 이는 단순한 Graph DB와 구분되는 가장 큰 특징임</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/0e822af1-d63a-46eb-9e65-888c3d60f98f/image.jpg" alt=""></p>
<h3 id="property-graph-pg">Property Graph (PG)</h3>
<p>Node와 Edge 내부에 Key-Value 속성을 저장하는 구조 중심의 모델</p>
<ul>
<li>Key-Value 속성 중심: 노드와 엣지 자체가 내부 속성(Property)를 가질 수 있는 구조, 엔티티와 관계에 대한 상세 데이터를 직관적으로 저장하고 그래프 순회에 유리한 모델</li>
<li>구조 및 분석 중심: 개념적 타입 (label)은 필수 요소가 아니며, 관계의 의미보다 연결 구조와 데이터 분석에 최적화된 네트워크 모델</li>
<li>표준 퀴리 언어의 부재: RDF의 SPARQL과 같은 단일 글로벌 표준이 없으며 주로 Gremlin 쿼리 언어를 사용하여 데이터를 조회함</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/3ff182bd-765d-48a5-bac9-98cc3224c638/image.jpg" alt=""></p>
<h3 id="labeled-property-graph-lpg">Labeled Property Graph (LPG)</h3>
<p>Property Graph에 명시적 Label이 추가된 모델</p>
<ul>
<li>PG 구현 모델 (Implementation): 추상적인 Property Graph 개념을 실제 시스템에서 사용할 수 있도록 구체화한 모델, Neo4j, TigerGraph, Azure, Cosos DB등 대부분의 상용 그래프 DB가 채택하고 있으며, 실무에서 가장 많이 사용됨</li>
<li>명시적 타입 시스템: PG와 달리, Node Label (개념 타입)과 Edge Type (관계유형)이 구조 수준에서 명시적으로 필수화되어 있음. 이를 통해 효율적인 인덱싱과 탐색이 가능</li>
<li>퀴리 언어 지원: Cypher, GQL, GSQL 등 종속성이 강한 쿼리 언어가 사용됨, 비록 공식 글로벌 표준은 아니지만, 실무에서 널리 쓰이는 사실상의 표준 (De facto) 역할을 함</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/10e911ee-881a-41f9-9e52-8a256a2e9d60/image.jpg" alt=""></p>
<h3 id="rdf-vs-pg-vs-lpq-비교분석">RDF vs PG vs LPQ 비교분석</h3>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/66110a33-d5aa-42fb-be69-c98111005483/image.jpg" alt=""></p>
<h2 id="2-semantic-layer">2. Semantic Layer</h2>
<h3 id="data-governance의-문제점">Data governance의 문제점</h3>
<ul>
<li>분산된 메트릭 정의: 팀별로 다른 &quot;매출&quot;의 정의, 불일치하는 계산로직</li>
<li>비효율적인 업무 반복: 매번 동일한 지표 추출을 위해 쿼리 새로 작성, 핵심 업무 (인사이트 도출)보다 데이터 조달에 시간 낭비</li>
</ul>
<h3 id="영향">영향</h3>
<ul>
<li>도구 간 사일로화: BI 도구별 파편화 및 단절, 일관된 정보 소스 없음, 일관된 정보 소스 없음</li>
<li>데이터 품질 악화: 데이터 파이프라인 전체로 오류 확산, 일관된 지표 통제 불가</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/2fe90f80-3974-4d2e-a1d9-1a3c2dddb030/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/ebe3a1bc-5241-45c5-b415-877105ed6b3c/image.jpg" alt=""></p>
<h3 id="semantic-layer의-정의">Semantic layer의 정의</h3>
<p>기존 팩트 데이터는 그대로 유지하되, 그 위에 온토로지, 메타데이터, 관계 정의를 포함하는 의미 계층을 덧씌우는 것</p>
<ul>
<li>특성
기존 fact data는 변경하지 않고, 위에 의미 계층을 추가 (온톨로지, 메타데이터), 여러 계층으로 구성 가능, 유기적으로 성장 (자동), 인위적으로 관리 (수동)</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/ff8fcf4f-96c3-4b2c-a8bd-17d5e48f34a2/image.jpg" alt=""></p>
<p>시맨틱 레이어는 고정된 한 계층이 아니라, 여러 계층의 집합이며 시간에 따라 성장한다.</p>
<h3 id="시맨틱-레이어의-성장방식">시맨틱 레이어의 성장방식</h3>
<p><strong>1. 유기적 성장 (자동)</strong></p>
<ul>
<li>데이터 패턴 학습</li>
<li>고객이 자주 사는 제품 조합 발견</li>
<li>자동으로 &quot;상품 번들&quot; 관계 추가</li>
<li>비즈니스 규칙의 진화: 초기 매출 = 주문금액, 6개월 후: 매출 = 주문금액 - 반품</li>
</ul>
<p><strong>2. 인위적 관리 (수동)</strong></p>
<ul>
<li>새로운 팀 온보딩 시 계층 추가: 마케팅 메트릭 계층, 캠페인 메타데이터</li>
<li>규제 준수 계층 추가: 개인정보보호 규칙, 감사 (audit) 메타데이터</li>
<li>불필요한 계층 제거/통합</li>
</ul>
<p>아래는 시맨틱레이어의 <strong><del>잘못된</del></strong> 설명이다.</p>
<ul>
<li>시맨틱 레이어는 고정된 한 계층</li>
<li>한번 설계하면 끝</li>
<li>변하지 않는 구조</li>
<li>모든 데이터를 RDF로 변환해야함 </li>
</ul>
<p><strong>올바른</strong> 이해는 아래와 같다.</p>
<ul>
<li>시맨틱 레이어는 여러 계층의 집합이다.</li>
<li>시간에 따라 성장하고 진화한다.</li>
<li>조직의 필요에 따라 유연하게 관리 및 조정한다.</li>
<li>필요시 추가/삭제가 가능하다.</li>
</ul>
<p>데이터 마트는 물리적 데이터 복사본이지만, 시맨틱 레이어는 추상화 계층이다. 데이터를 복제하지 않고 의미만 정의한다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/a333ab10-19cd-40cb-abbf-e7e83cb486be/image.jpg" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/a1c95b98-3348-44d0-a95b-9bc092b2ecd4/image.jpg" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/5109f768-c27c-47e8-b13c-858408f2b6ab/image.jpg" alt=""></p>
<h3 id="rdf가-필요한-경우-vs-불필요한-경우">RDF가 필요한 경우 vs 불필요한 경우</h3>
<p>RDF가 <strong>적합</strong> (특수한 경우)</p>
<ul>
<li>복잡한 의미 추론: OWL 온톨로지 자동 추론, 복잡한 관계 쿼리</li>
<li>극도로 불규칙한 스키마: 각 엔티티가 다른 속성, RDF의 유연성 필요</li>
<li>연합 데이터: 여러 조직 간 데이터 공유, 표준 온톨로지 기반 통합</li>
</ul>
<p>RDF <strong><del>피해야</del></strong> 할 경우</p>
<ul>
<li>고주파 시계열 데이터: 0.1초 센서 데이터, 1 데이터 = 3 트리플 (오버헤드)</li>
<li>ACID 필수 금융거래: RDF는 최종 일관성만 보장, 프랜잭션 무결성 불가</li>
<li>밀리초 응답 시스템: 주문 처리, 실시간 API, RDF 쿼리 지연 높음</li>
</ul>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/ff8a89c6-605f-4d45-8577-33898bd98edd/image.jpg" alt=""></p>
<h3 id="semantic-layer-핵심-요약">Semantic Layer 핵심 요약</h3>
<blockquote>
<ol>
<li>기존 DB는 그대로, 위에 의미계층 추가</li>
<li>시맨틱 레이어는 성장하고 진화하는 구조</li>
<li>대부분의 경우 RDF/트리플 스토어 불필요</li>
<li>LLM으로 비정형 문서 구조화 가능</li>
</ol>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/280213ae-9386-47ca-a45f-de8e6891c57e/image.jpg" alt=""></p>
<h3 id="acknowledgement">Acknowledgement</h3>
<p>본 포스팅은 지그재그 세미나 4회에서 제공된 pdf 발표자료를 기반으로 작성되었다. 원본 자료와 발표자 정보가 궁금하다면, 아래 Reference에 지그재그 hompage 링크를 올려두었으니 참고하길 바란다. <img src="https://velog.velcdn.com/images/seohyun_nam/post/841d07fb-8b61-4908-9896-ab690ec5491c/image.jpg" alt=""></p>
<h4 id="reference">Reference</h4>
<p><a href="https://slashpage.com/zigzag/4w67rj24gqx4jm5yq8ep">https://slashpage.com/zigzag/4w67rj24gqx4jm5yq8ep</a>
<a href="https://joyhong.tistory.com">https://joyhong.tistory.com</a>
<a href="https://github.com/LangChain-OpenTutorial/LangChain-OpenTutorial/blob/main/19-Cookbook/03-GraphDB/05-TitanicQASystem.ipynb">https://github.com/LangChain-OpenTutorial/LangChain-OpenTutorial/blob/main/19-Cookbook/03-GraphDB/05-TitanicQASystem.ipynb</a>
<a href="https://www.youtube.com/watch?v=FvGndkpa4K0">SPARQL in 11 minutes (youtube)</a>
<a href="https://github.com/gazgiz">https://github.com/gazgiz</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[모두의 NeurIPS: 저자들과 함께하는 연구수다]]></title>
            <link>https://velog.io/@seohyun_nam/%EB%AA%A8%EB%91%90%EC%9D%98-NeurIPS-%EC%A0%80%EC%9E%90%EB%93%A4%EA%B3%BC-%ED%95%A8%EA%BB%98%ED%95%98%EB%8A%94-%EC%97%B0%EA%B5%AC%EC%88%98%EB%8B%A4</link>
            <guid>https://velog.io/@seohyun_nam/%EB%AA%A8%EB%91%90%EC%9D%98-NeurIPS-%EC%A0%80%EC%9E%90%EB%93%A4%EA%B3%BC-%ED%95%A8%EA%BB%98%ED%95%98%EB%8A%94-%EC%97%B0%EA%B5%AC%EC%88%98%EB%8B%A4</guid>
            <pubDate>Sat, 14 Feb 2026 17:27:19 GMT</pubDate>
            <description><![CDATA[<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/9256b6ea-28b0-4d18-b29a-d30b90d93a98/image.jpg" alt=""></p>
<h2 id="neurips-란">NeurIPS 란?</h2>
<ul>
<li>매년 12월 개최되는 세계 최대 규모이자 최고 권위의 인공지능 및 기계학습 학술대회</li>
<li>머신러닝, 신경과학 분야의 핵심 기술이 발표되며, 이곳에 논문이 채택되면 세계적인 기술력을 인정받는 것으로 간주됨</li>
<li>NeurIPS 2025의 경우 21,575편 제출, 5,290편 승인</li>
<li>우수 논문의 경우 구두발표(oral) 및 spotlight</li>
<li>Main conference와 workshop으로 구분</li>
</ul>
<h2 id="프로그램-개요">프로그램 개요</h2>
<p>행사명: [랩 활동 공유회] 모두의 NeurIPS: 저자들과 함께하는 연구수다
접수 기간: <del>2026.2.9(월)
일시: 2026.2.10(화) 19:00</del>21:30
장소: 모두의연구소 강남캠퍼스 라운지(서울 강남구 강남대로 324 역삼디오슈페리움 2층)
참가 방법: 모두의연구소 홈페이지에서 신청( <a href="https://biz.modulabs.co.kr/event/387">https://biz.modulabs.co.kr/event/387</a> )
프로그램 요약:  글로벌 탑티어 AI 학회 NeurIPS 및 AAAI 저자들의 후기를 듣고 교류하는 세미나</p>
<blockquote>
<p>프로그램 세부
 • Long-tailed 분포의 생성 모델 개선 연구 성과 및 NeurIPS 2025 후기
    ▷ 연사 : 김민중 랩장님 (모두의연구소 &lt;생성모델 개선연구&gt; LAB | 국가수리과학연구소)
 • 아이디어에서 논문까지: 두 학회로 보는 LLM 연구 실전기
    ▷ 연사 : 명지윤 랩장님 (모두의연구소 LAB | 삼성 SDS)
 • Q&amp;A 및 네트워킹</p>
</blockquote>
<h2 id="중앙대학교-레인보우-시스템">중앙대학교 레인보우 시스템</h2>
<p> 중앙대학교 레인보우시스템은 대학교 소속 학생들을 위한 학생자기계발통합 관리시스템으로 진로설정, 역량개발, 취업정보, 커뮤니티 활동을 도와주는 플랫폼이다. 나는 가끔씩 비교과 프로그램이나 외부 프로그램 (직무경험 및 교육, 인턴정보 및 청년일경험) 관련해서 정보가 필요하거나, 궁금할 때 평소에 많이 해당 웹사이트를 이용하고 스스로 찾아보려고 한다. </p>
<p>-_ <strong>해당 세미나 또한 후기 이벤트를 진행하긴 했으나, 현장 당일 이벤트 였기 때문에 본 포스팅과는 아무런 관련이 없다</strong>._</p>
<p> <img src="https://velog.velcdn.com/images/seohyun_nam/post/a963c2da-7144-4e7f-8bab-78bfd884de50/image.jpg" alt=""></p>
<p>국제학회 구두 발표 경험이 있으나, NeurIPS, ICML, EMNLP, NAACL과 같은 AI 관련 최상위 국제학술대회를 경험해본 적은 없어서 이런 학회에 실제로 경험이 있는 사람들이 전달해주는 정보와 경험이 궁금했다. 더불어 이런 학회에 논문투고를 설사 하지 못한다 하더라도, 기본적으로 이런 학회를 마음속에 목표를 두고 연구를 해야한다는 생각을 가지고 있기 때문에, 여러방면에서 나에게 의미있는 경험이 될 것 같았다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/c4af620b-448e-41cc-8d4e-01fed0274565/image.jpg" alt=""></p>
<h2 id="세미나-참석-후기">세미나 참석 후기</h2>
<p>세미나 참석이 확정되어 사전 안내 메시지를 받았다. 
행사 당일 조금 일찍 연구실에서 나와 중앙대 병원 앞에서 452번 버스를 타고 강남역 4번출구 앞에서 내렸다. 이날 유독 비가 많이 내렸던 것으로 기억한다. 도보로 조금 걷다보니 에슐리 퀸즈 옆 2층에 모두의 연구소 간판이 보였다. </p>
<p> <img src="https://velog.velcdn.com/images/seohyun_nam/post/ede139ea-9f9a-455e-97c9-378273f12967/image.jpg" alt=""></p>
<p> 자리에 착석해서 WIFI를 연결을 하려고 자세히 봤더니 password가 (from MODULABS import future ..ㅋㅋ) 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/033c29c3-289f-4ec3-a298-0dd5b17d15ef/image.jpg" alt=""></p>
<h2 id="neurips-누구에게-좋은지">NeurIPS 누구에게 좋은지?</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/c0460e30-dd03-4aa7-8926-3a28fd4a0bf5/image.jpg" alt=""></p>
<p>이 부분은 김민중 국가수리과학연구소장님께서 말씀해주신 내용을 토대로 정리해 보려고 한다.</p>
<h3 id="tips">Tips</h3>
<blockquote>
<ol>
<li>영어발표나 포스터 내용을 거의 이해하지 못하는 수준이면, 실제로 얻어가는 것이 많지 않을 수 있음</li>
<li>공식 프로그램과 행사 일정이 매우 빡빡해서 체력 관리가 중요함</li>
<li>처음보는 사람들과 대화하고 교류하는 데 큰 부담이 없는 사람일수록 경험이 훨씬 더 풍부해짐</li>
<li>전공, 관심 분야가 다른 한국 사람들과 번개 모임을 해도 기대한 만큼의 정보나 인맥 측면에서 소득이 없을 수 있음</li>
<li>점심(lunch box) 제공, (비건, 할랄, 코서 등)</li>
<li>Social program을 참석하면 네트워킹과 무료 저녁 식사가 가능함</li>
</ol>
</blockquote>
<h3 id="직장인-연구원-엔지니어-데이터-사이언티스트의-경우">직장인 (연구원, 엔지니어, 데이터 사이언티스트)의 경우</h3>
<blockquote>
<ol>
<li>AI, ML 등 실무에 바로 이어지는 최신 트렌드를 한번에 파악해보고 싶은 사람</li>
<li>회사에서 ML을 쓰고 있고, &quot;지금 우리가 하는 방법이 최선인가?&quot;를 벤치마크하고 싶은 사람</li>
<li>해외 이직, 커리어 전환을 고민하며, 부스-소셜에서 업계 사람들과 네트워킹, 채용 정보를 얻고 싶은 사람</li>
</ol>
</blockquote>
<p> <img src="https://velog.velcdn.com/images/seohyun_nam/post/e342aff4-6c08-4e04-ad2c-8afab8344f74/image.jpg" alt=""></p>
<p>AAAI의 경우, 삼성 SDS 명지운 엔지니어님께서 관련 내용을 설명해 주셨는데, 현재 삼성전자 가전제품에서 활용될 수 있는 RAG, 챗봇 서비스를 개발관련 업무를 하고 계셨다.
요즘 연구 키워드가 Agentic workflow, AI Reliability, Deployability (Enterprise Application) 크게 3개의 축으로 이루어져 있다고 말씀해주셨다. </p>
<p>실제로 AAAI에 게제가 확정된 논문에 대해서는, 대기업에서 진행하는 연구이다보니 현업에서 협업을하는 구조가 많이 있고 (근데 이건 꼭 대기업이라서 그런건 아닌것 같다) 실제로 다양한 부서에서의 의견을 반영한점을 연구에 적용하다보니 이것이 차별화 포인트가 되었다고 했다. </p>
<p>실무에서는 multi-turn 대화 맥락속에서, multi-querying, top-k를 늘리는 방법을 주로 많이 이용하고 있으며 초기에 prompting을 최대한 자세히하려고 노력한다고 말씀하셨다. fine-tuning이라고 하는것이 꼭 practical한 방법이 될 수는 없다고도 덧붙여 설명해 주셨다. </p>
<h3 id="reference">Reference</h3>
<p><a href="https://rainbow.cau.ac.kr/site/main/index007">https://rainbow.cau.ac.kr/site/main/index007</a>
<a href="https://modulabs.co.kr/?NaPm=ct%3Dmlmktp5z%7Cci%3Dcheckout%7Ctr%3Dds%7Ctrx%3Dnull%7Chk%3Dcec682c3ee701b13880ce6c3c152d35a31a427ca">https://modulabs.co.kr/?NaPm=ct%3Dmlmktp5z%7Cci%3Dcheckout%7Ctr%3Dds%7Ctrx%3Dnull%7Chk%3Dcec682c3ee701b13880ce6c3c152d35a31a427ca</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Upstage Document Parse: Making Documents AI-Readable]]></title>
            <link>https://velog.io/@seohyun_nam/Upstage-Document-Parse-Making-Documents-AI-Readable</link>
            <guid>https://velog.io/@seohyun_nam/Upstage-Document-Parse-Making-Documents-AI-Readable</guid>
            <pubDate>Sun, 07 Dec 2025 09:10:14 GMT</pubDate>
            <description><![CDATA[<h2 id="document-digitization이란">Document digitization이란?</h2>
<p>Document digitization은 문서를 정보 검색이나 요약과 같은 후속 작업을 위해 텍스트, HTML, Markdown 등의 기계가 읽을 수 있는 형식으로 변환하는 과정을 의미한다.</p>
<p>Upstage에서 제공하는 Document digitization 기술에는 2가지가 있다. </p>
<blockquote>
<h3 id="document-parsing">Document parsing</h3>
<p>문서 레이아웃 분석과 함께 텍스트를 감지하고 인식하여, 문서를 HTML 또는 Markdown과 같은 structured, LLM-readable 형식으로 변환하는 기술.</p>
</blockquote>
<blockquote>
<h3 id="document-ocr">Document OCR</h3>
<p>문서에서 text를 감지하고 인식하며, 각 text의 location 정보까지 함께 추출하는 기술.</p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/188ec8e1-b3ed-4490-be69-bf963b741e8e/image.jpg" alt=""></p>
<p>해당 글에서는 Document parsing에 대해서 좀 더 구체적으로 다루어 보려고 한다. 해당 기술은 Multi-page documents 에서 압도적인 속도를 자랑하는데, Upstage Document Parse는 100페이지 문서를 1분 이내에 처리한다. 50–100페이지 범위의 문서를 동일한 설정으로 처리하는 경우, 경쟁 서비스인 Unstructured와 AWS Textract보다 평균 10배, LlamaParse보다 평균 4배 더 빠른 성능을 보였다.</p>
<h2 id="so-what-exactly-is-document-parsing">So what exactly is Document parsing?</h2>
<p>Document parsing은 어떤 문서든 자동으로 HTML 또는 Markdown과 같은 구조화된 텍스트로 변환하는 과정을 말한다.
이 과정에서는 문서의 문단, 표, 이미지 등 레이아웃 요소를 감지하여 문서의 구조를 파악한다. 이후 API가 읽기 순서에 따라 요소들을 직렬화하고, 최종적으로 문서를 구조화된 텍스트로 변환한다. 현재 2가지 모델을 사용할 수 있다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/c24b9a10-777f-43a3-9759-a31330cc947a/image.jpg" alt=""></p>
<p>Upstage Document Parse는 입력문서에서 다양한 레이아웃 카테고리를 식별하고 이를 HTML tag로 변환한다.
아래 표는 문서 내 레이아웃 카테고리와 각각에 매핑되는 HTML tag를 설명한다. 만약 특정 레이아웃 카테고리에 적절한 tag가 존재하지 않으면, 모델이 감지한 레이아웃 유형을 설명하기 위해 &quot;p&quot; tag에 data-category 속성을 추가하여 표현한다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/dafa77ec-faf0-4add-bbe2-2124f2843655/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/49be3c6a-818a-4807-801d-3261b368f10a/image.jpg" alt=""></p>
<p>문서 안의 차트에는 유용한 정보가 포함되어 있지만, 일반적으로 이미지로만 파싱되기 때문에 검색, QA, RAG 같은 작업에서 활용하기 어렵다.
차트에서 수치 데이터를 추출해 table로 변환하면 기존의 텍스트 기반 파이프라인과 자연스럽게 통합되며, 차트 정보를 효과적으로 활용할 수 있다.</p>
<p>멀티모달 LLM을 사용해 이 문제를 해결할 수도 있지만, 비용이 더 높고 파이프라인이 복잡해지는 단점이 있다. 반면 Upstage Document parse의 경우 텍스트 기반 LLM과 호환되는 방식이 더 효율적이다. 차트 인식 기능은 아래에 제시된 차트 유형들을 감지하고 표 형식으로 변환한다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/385368f8-bd93-4d79-92f4-b6e86a856ce8/image.jpg" alt=""></p>
<p>다음과 같이 여러 페이지에 걸쳐 존재하지만 동일한 구조를 가진 표를 자동으로 감지하고 병합하는 기능 또한 제공한다.
이 기능을 활성화하려면 요청 시 merge_multipage_tables=true parameter를 설정하면 된다.
표가 병합되면, 연결된 표들 중 첫 번째 표 요소에 전체 내용이 통합되고, 이후 병합된 다른 표 요소들은 병합 결과가 반영된 상태로 업데이트된다.긴 데이터 표가 page 구분으로 인해 여러 페이지에 걸쳐 나뉘어 있을 때, page 경계를 넘더라도 데이터의 연속성을 유지해야 할 때 특히 유용하다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/1b09587b-c0d2-4247-a3d1-a70682a052dc/image.jpg" alt=""></p>
<p>Upstage console &quot;playground&quot;기능을 활용해서 Document parsing 기능을 사용해보겠다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/65df5b84-a95f-44a6-8c39-97e3b570e3a0/image.jpg" alt=""></p>
<p>우측의 &quot;Configuration&quot; 설정 창에서 document-parse-250618, document-parse-nightly 모델 2가지 중에서 하나를 선택해서 사용하면 된다. Document parse의 경우 2가지 mode가 있는데, &quot;Standard&quot;, &quot;Enhanced&quot; 둘 중 하나를 선택할 수 있다. 구조가 명확하고 정돈되어 있는 문서는 &quot;Standard&quot; 모드를 선택하면 되고, 만약 레이아웃이 복잡하거나 scan quality가 낮은 문서의 경우에는 &quot;Enhanced&quot; 모드를 선택하면 된다. 다만, 최근에 출시된 &quot;Enhanced&quot; mode 같은 경우에는 document-parse-nightly 모델을 선택해야지만 사용가능하다. 상세하게 옵션을 살펴보면, 위에서 언급했던, &quot;Merge Multipage Tables&quot; 기능도 활성화하여 사용할 수 있는 모습을 볼 수 있다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/4d181b8b-3718-41f6-84b8-3b15dc9e5d01/image.jpg" alt=""></p>
<h3 id="reference">Reference</h3>
<p><a href="https://console.upstage.ai/docs/capabilities/digitize">https://console.upstage.ai/docs/capabilities/digitize</a>
<a href="https://console.upstage.ai/docs/capabilities/digitize/document-parsing">https://console.upstage.ai/docs/capabilities/digitize/document-parsing</a>
<a href="https://console.upstage.ai/api/document-digitization/document-parsing">https://console.upstage.ai/api/document-digitization/document-parsing</a>
<a href="https://developers.llamaindex.ai/python/cloud/llamaparse/">https://developers.llamaindex.ai/python/cloud/llamaparse/</a>
<a href="https://console.upstage.ai/playground/document-parsing">https://console.upstage.ai/playground/document-parsing</a>
<a href="https://www.upstage.ai/blog/en/let-llms-read-your-documents-with-speed-and-accuracy">https://www.upstage.ai/blog/en/let-llms-read-your-documents-with-speed-and-accuracy</a>
<a href="https://www.upstage.ai/blog/en/difference-of-ie-and-dp">https://www.upstage.ai/blog/en/difference-of-ie-and-dp</a>
<a href="https://docs.reducto.ai/parsing/configs/enrich-configuration">https://docs.reducto.ai/parsing/configs/enrich-configuration</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Upstage Document classification]]></title>
            <link>https://velog.io/@seohyun_nam/Upstage-Document-classification</link>
            <guid>https://velog.io/@seohyun_nam/Upstage-Document-classification</guid>
            <pubDate>Sun, 30 Nov 2025 07:30:47 GMT</pubDate>
            <description><![CDATA[<h2 id="document-parse-vs-information-extract">Document Parse vs Information extract?</h2>
<p>Document classification 기술을 설명하기 전에 먼저 핵심적으로 알아야할 2가지 기술을 이해하기 쉬운 예시를 들어 설명하겠다. </p>
<p>고객사에서 아래와 같은 요청이 있다고 가정해보자.</p>
<blockquote>
<ol>
<li>“이 계약서에서 계약 금액을 추출해줘.”</li>
<li>“이 계약서에서 위약금 조항을 찾아서 설명해줘.”</li>
</ol>
</blockquote>
<p>두 요청 모두 문서를 처리한다는 점에서는 동일하지만, 필요한 기술은 근본적으로 다르다. 서로 다른 팀 / 부서마다 발생하는 문제와 필요한 요구사항이 다르기 때문에 각각 상황에 부합하는 해결방안을 제시하는 것이 매우 중요하다.</p>
<blockquote>
<p>첫 번째 요구사항에서 활용할 수 있는 기술: 
Information Extraction,
두 번째 요구사항에서 사용할 수 있는 기술: 
Document Understanding (Parse)</p>
</blockquote>
<p>Document Parse는 Document를 HTML이나 Markdown과 같은 LLM이 읽을 수 있는 형식으로 변환하는 기술이고, Information Extract는 필요한 데이터만을 structured JSON 형태의 key–value 쌍으로 추출하는 기술이다.</p>
<p>여기서 &quot;Structured outputs&quot;의 장점을 부연 설명하자면, 이는 사용자가 제공한 JSON schema를 기반으로 JSON 형식의 결과를 생성하여 정보를 표준화된 방식으로 추출·정리할 수 있게 해주는 기능이다. 이를 통해 추출된 데이터는 기계가 읽기 쉽고, 다양한 애플리케이션과 시스템에 유연하게 연동할 수 있다.</p>
<p>아래 캡쳐 사진은 Upstage official tech-blog &quot;Document parse vs Information extract: What&#39;s the difference?&quot;을 주제로 작성된 포스팅 내용에서 참고한 비교분석 표이다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/a752460f-0afa-4b3b-9b98-46c9bfe9dcad/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/344f2f86-479a-47fe-bb73-58d44579c978/image.jpg" alt=""></p>
<h2 id="document-classification이란">Document Classification이란?</h2>
<p>문서 분류는 입력된 문서를 사용자가 정의한 category 중 하나로 자동 분류하는 기술이다. 스캔된 이미지, 사진, digital PDF 등 형태에 관계없이 적용할 수 있으며, 템플릿이나 모델 fine-tuning없이 사용할 수 있다.</p>
<h3 id="advantages">Advantages</h3>
<ul>
<li>어떤 문서든 처리 가능: 스캔본, 사진, 디지털 문서 등 형식에 상관없이 높은 인식 성능 제공</li>
<li>유연한 분류 체계: 도메인에 맞게 라벨을 자유롭게 정의하고 수정 가능</li>
<li>no fine-tuning: 템플릿이나 학습 과정 없이 즉시 배포 가능 운영 비용 절감</li>
<li>일관된 운영: 문서 라우팅 및 자동화 분기 처리에 바로 적용 가능</li>
</ul>
<p>Upstage model들은 playground에서 직접 사용해 볼 수 있다. Document classification기능을 체험해보기 위해 &quot;Upstage Playground&quot;에서 sample 자료들을 가지고 이 기술이 어떻게 활용될 수 있는지 실습해보겠다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/7bf22180-568e-41af-864f-8b819d0d9898/image.jpg" alt="">
 Upstage console에서 samples (US Tax &amp; Income &amp; Logistics) 문서들을 다운로드 받고 하단 우측의 &quot;Classify all&quot; 버튼을 클릭한다. 대용량의 문서를 업로드 한게 아니여서 짧은시간 안에 process가 마무리 되었다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/689002c3-f356-4f68-bfa8-845c8fdb0e55/image.jpg" alt=""><img src="https://velog.velcdn.com/images/seohyun_nam/post/d8000c1d-96e6-4969-9dea-cf9aca131185/image.jpg" alt=""></p>
<p>우측 Class description을 확인해보면 &quot;label&quot;(category)과 그에 해당하는 &quot;description&quot;이 matching되어 분류가 잘 된 모습을 확인할 수 있다. 해당 기술은 앞서 설명한 예시 이외에도 다양한 산업분야에 적용 가능하고 업무의 효율성을 극대화 할 수 있는 매우 우수한 솔루션이라고 생각한다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/2bcf437f-86b8-431d-aa70-1fd187d1d49d/image.jpg" alt=""></p>
<h3 id="reference">Reference</h3>
<p><a href="https://console.upstage.ai/docs/capabilities/classify">https://console.upstage.ai/docs/capabilities/classify</a>
<a href="https://console.upstage.ai/api/document-classification">https://console.upstage.ai/api/document-classification</a>
<a href="https://www.upstage.ai/blog/en/difference-of-ie-and-dp">https://www.upstage.ai/blog/en/difference-of-ie-and-dp</a>
<a href="https://console.upstage.ai/docs/capabilities/generate/structured-outputs">https://console.upstage.ai/docs/capabilities/generate/structured-outputs</a>
<a href="https://json-schema.org/overview/what-is-jsonschema">https://json-schema.org/overview/what-is-jsonschema</a>
<a href="https://www.upstage.ai/">https://www.upstage.ai/</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Upstage Information Extraction]]></title>
            <link>https://velog.io/@seohyun_nam/Upstage-Information-Extraction</link>
            <guid>https://velog.io/@seohyun_nam/Upstage-Information-Extraction</guid>
            <pubDate>Sun, 23 Nov 2025 11:22:23 GMT</pubDate>
            <description><![CDATA[<h2 id="information-extract가-무엇인가">Information extract가 무엇인가?</h2>
<p>Information extraction은 어떤 종류의 문서라도 핵심 정보를 추출할 수 있는 기술을 의미한다.
기존의 사전 구축형 정보 추출(prebuilt IE)은 특정 문서 유형에 맞춰 fine-tuning을 해야 하지만,
Universal IE는 추가적인 학습이나 customizing process없이 아무 문서나 바로 처리하고 필요한 정보를 추출할 수 있다.</p>
<h2 id="schema">Schema</h2>
<p>정보추출을 위한 스키마를 얻는 방법에는 2가지가 있다.</p>
<blockquote>
<ol>
<li>Automatic schema generation</li>
<li>Manual schema design</li>
</ol>
</blockquote>
<h3 id="automatic-schema-generation">Automatic schema generation</h3>
<p>스키마를 수동으로 직접 설계하는 일은 번거롭다.
반면, Schema Generation API를 사용하면 최대 3개의 샘플 파일만으로 초기 스키마를 손쉽게 생성할 수 있다.</p>
<p>추출된 스키마는 문자열 형태의 JSON 객체로 메시지 내용에 반환된다.
이 스키마는 Information Extract API의 JSON Schema 문법 및 입력 스키마 규칙을 따른다.
또한 사용자는 system message를 통해 스키마 생성에 대한 의도를 API에 전달할 수 있다.</p>
<h3 id="manual-schema-design">Manual schema design</h3>
<p>Schema는 JSON schema syntax에 따라 작성되어야 하고 사용가능한 type은 아래와 같다.
type에는 총 6개의 종류가 존재하며, string, number, integer, boolean, array, object가 있다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/d7f171da-1688-4bbf-bd02-62ae0fcc6521/image.jpg" alt=""></p>
<p>여기서 주의해야할 점은 root object는 반드시 object type 이어야 한다는 것이다. </p>
<pre><code>{
  &quot;type&quot;: &quot;object&quot;,
  &quot;properties&quot;: {
    &quot;transactions&quot;: {
      &quot;type&quot;: &quot;array&quot;,
      &quot;items&quot;: {
        &quot;type&quot;: &quot;object&quot;,
        &quot;properties&quot;: {
          &quot;transaction_date&quot;: {
            &quot;type&quot;: &quot;string&quot;,
            &quot;description&quot;: &quot;Date on which each transaction occurred.&quot;
          },
          &quot;transaction_description&quot;: {
            &quot;type&quot;: &quot;string&quot;,
            &quot;description&quot;: &quot;Description of each transaction.&quot;
          }
        }
      }
    }
  }
}</code></pre><h3 id="arrays">Arrays</h3>
<p>같은 key에 대해 여러 값을 추출해야 한다면, array type을 사용할 수 있다. 
{&quot;type&quot;: &quot;array&quot;} 형태로 작성할 때에는, 배열 내부값의 구조를 정의하기 위해 &quot;items&quot; keyword를 반드시 포함해야한다.</p>
<h3 id="objects">Objects</h3>
<p>하나의 key 아래에 여러 properties를 정의하려면 object type을 사용한다. 
{&quot;type&quot;: &quot;object&quot;}로 선언한 후, 구조를 정의하기 위해서 &quot;properties&quot; keyword가 이어져야 한다. 
더불어, object type은 array의 items로도 사용될 수 있어, table처럼 여러 row를 표현할 때 활용된다. </p>
<h3 id="schema-design-restrictions">Schema design restrictions</h3>
<p>직접 스키마를 설계할 때는 다음과 같은 제약사항들이 존재한다.</p>
<p>스키마 내 모든 property 이름과 definition 이름의 총 문자열 길이는 10,000자를 초과할 수 없다.</p>
<ul>
<li><p>동기(synchronous) API: 최대 100개의 object property / 최대 15,000자까지 허용</p>
</li>
<li><p>비동기(asynchronous) API: 최대 5,000개의 object property / 최대 120,000자까지 허용</p>
</li>
</ul>
<pre><code>{
  &quot;type&quot;: &quot;object&quot;,
  &quot;properties&quot;: {
    &quot;bank_name&quot;: {
      &quot;type&quot;: &quot;object&quot;,  # ❌ Object type properties are not allowed in the first-level
      &quot;properties&quot;: {
          ...
      }
    }
  }
}</code></pre><p>first-level property는 반드시 다음 타입 중 하나여야 한다. string, integer, number, array (object 타입은 최상위 레벨에 허용되지 않는다.)</p>
<pre><code>{
  &quot;type&quot;: &quot;object&quot;,
  &quot;properties&quot;: {
    &quot;bank&quot;: {
      &quot;type&quot;: &quot;array&quot;,
      &quot;items&quot;: { &quot;type&quot;: &quot;array&quot;, &quot;items&quot;: {...}}  # ❌ Nested arrays are not allowed
    }
  }
}</code></pre><p>좀 더 쉬운 이해를 위해 아래 표를 참고하여 동기 API와 비동기 API의 차이점을 설명하도록 하겠다.</p>
<h3 id="synchronous-api">Synchronous API</h3>
<p>요청이 발생하면, 처리가 완료될때까지 기다리고 즉시 결과를 반환한다. 
동기 API는 작은 문서 처리, 간단한 스키마, 빠른 응답이 필요한 경우에 적합하다.
제한사항으로는 동기 API가 문자수와 property 수 제한에 더 엄격하다는 것이다. 
동기 API는 결과를 받을때까지 연결을 유지해야한다.</p>
<h3 id="asynchronous-api">Asynchronous API</h3>
<p>요청이 발생하면, 즉시 task ID를 반환하고 나중에 별도 요청으로 결과를 조회한다. 
비동기 API는 대용량의 문서, 복잡한 스키마, 여러문서를 한번에 처리하는 batch 작업에 적합하며 긴 처리시간이 예상되는 경우에 적절하다.
비동기 API는 더 넓은 범위(최대 5,000 properties, 120,000 chars)를 지원한다.
비동기 API는 연결을 유지할 필요없기 때문에 네트워크 risk 감소효과가 있다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/0da2a65b-babc-495c-974a-ccb86c09a3c3/image.jpg" alt=""></p>
<h2 id="advantages-of-using-asynchronous-api">Advantages of using Asynchronous API?</h2>
<p>비동기 API는 다음과 같은 장점이 있다.</p>
<blockquote>
<ol>
<li>대용량 문서와 복잡한 스키마를 장시간 연결을 유지하지 않고도 처리가 가능하다.</li>
<li>하나의 요청에 여러 문서를 batching하여 대량으로 처리 가능하다.</li>
<li>대규모 문서처리 workflow에서 resources 사용 최적화가 가능하다.</li>
</ol>
</blockquote>
<p>간단하게 정리하자면, 비동기 API를 사용함으로써 오래 걸리는 작업이나 대규모 문서처리가 효율적이게 된다. 반대로, 단일 문서를 빠르게 처리해야하고 즉시 결과물이 필요한 경우에는 비동기 API 대신 동기 API를 사용하는 것이 좋다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/1c04eb05-659c-47fa-b9c5-cb80df5fbf1f/image.jpg" alt=""></p>
<h3 id="additional-parameters">Additional parameters</h3>
<p>비동기 API는 동기 API와 동일하게 데이터 추출 능력을 강화하기 위해 다양한 추가 파라미터를 지원한다.</p>
<blockquote>
<ol>
<li>Mode: standard와 Enhanced 중 선택 가능</li>
<li>doc_split: 하나의 파일안에 여러 문서가 포함되어 있을 경우, 이를 자동으로 분할해 각각의 문서에서 정보를 추출하는 기능</li>
<li>location: 추출된 각 field에 대해 page number, bounding box 좌표(x,y) 등의 위치 정보를 함께 제공하도록 설정</li>
<li>Confidence: 각 추출 field에 대해 high / low 형태의 confidence score를 포함하여 결과의 신뢰성을 평가할 수 있게 하는 option</li>
</ol>
</blockquote>
<pre><code>data = {
    &quot;model&quot;: &quot;information-extract&quot;,
    &quot;schema&quot;: json.dumps(schema),
    &quot;mode&quot;: &quot;enhanced&quot;,  # Use enhanced mode
    &quot;location&quot;: True,  # Get location coordinates
    &quot;confidence&quot;: True  # Get confidence scores
}

response = requests.post(
    f&quot;{BASE_URL}/async&quot;,
    headers=headers,
    files=files,
    data=data
)</code></pre><h3 id="basic-async-job-workflow">Basic Async job workflow</h3>
<pre><code>import requests
import time
import json

API_KEY = &quot;YOUR_API_KEY&quot;
BASE_URL = &quot;https://api.upstage.ai/v1/information-extraction&quot;

#Step 1: Create async job
headers = {&quot;Authorization&quot;: f&quot;Bearer {API_KEY}&quot;}
files = {
    &quot;documents&quot;: [
        (&quot;documents&quot;, open(&quot;document1.pdf&quot;, &quot;rb&quot;)),
        (&quot;documents&quot;, open(&quot;document2.pdf&quot;, &quot;rb&quot;))
    ]
}
data = {
    &quot;model&quot;: &quot;information-extract&quot;,
    &quot;schema&quot;: json.dumps({
        &quot;type&quot;: &quot;object&quot;,
        &quot;properties&quot;: {
            &quot;bank_name&quot;: {
                &quot;type&quot;: &quot;string&quot;,
                &quot;description&quot;: &quot;The name of bank in bank statement&quot;
            }
        }
    })
}

response = requests.post(f&quot;{BASE_URL}/async&quot;, headers=headers, files=files, data=data)
job_data = response.json()
job_id = job_data[&quot;job_id&quot;]
print(f&quot;Job created: {job_id}&quot;)

#Step 2: Poll job status
while True:
    response = requests.get(f&quot;{BASE_URL}/jobs/{job_id}&quot;, headers=headers)
    job_info = response.json()
    status = job_info[&quot;status&quot;]
    print(f&quot;Job status: {status}&quot;)

    if status in [&quot;COMPLETED&quot;, &quot;FAILED&quot;, &quot;CANCELED&quot;]:
        break

    time.sleep(5)  # Wait 5 seconds before checking again

#Step 3: Retrieve results
if status == &quot;COMPLETED&quot;:
    response = requests.get(
        f&quot;{BASE_URL}/jobs/{job_id}?with_result=true&quot;,
        headers=headers
    )
    results = response.json()
    print(json.dumps(results, indent=2))</code></pre><h2 id="upstage-information-extract">Upstage Information extract?</h2>
<ul>
<li>어떤 문서 타입도 처리 가능
복잡한 PDF, 스캔 이미지, Microsoft Office 문서 등 다양한 형식의 문서를 안정적으로 처리하여 데이터를 추출할 수 있다.</li>
<li>스키마에 구애받지 않는 처리(schema-agnostic)
주어진 schema에 따라 동적으로 구조화된 출력을 생성할 수 있어, 다양한 사용 사례에 맞춰 즉석에서 customizing이 가능하다.</li>
<li>숨겨진 정보까지 추출
문서에 명시적으로 적혀 있지 않은 정보도 추론하여 추출할 수 있다.
예를 들어, 여러 라인 아이템을 기반으로 total amount을 계산하거나, 문서에 직접적으로 라벨링되지 않은 핵심 정보를 찾아낼 수 있다.</li>
<li>추가 학습 불필요
사전에 만들어진 템플릿이나 모델 재학습 없이도 문서에서 필요한 정보를 바로 추출할 수 있다.</li>
</ul>
<h3 id="reference">Reference</h3>
<p><a href="https://www.upstage.ai">https://www.upstage.ai</a>
<a href="https://console.upstage.ai/docs/capabilities/extract/writing-a-schema">https://console.upstage.ai/docs/capabilities/extract/writing-a-schema</a>
<a href="https://console.upstage.ai/docs/capabilities/extract/universal-extraction-async">https://console.upstage.ai/docs/capabilities/extract/universal-extraction-async</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[CAU-AI핵심기술 세미나: 효과적인 해외 학술지 투고 전략]]></title>
            <link>https://velog.io/@seohyun_nam/CAU-AI%ED%95%B5%EC%8B%AC%EA%B8%B0%EC%88%A0-%EC%84%B8%EB%AF%B8%EB%82%98-%ED%9A%A8%EA%B3%BC%EC%A0%81%EC%9D%B8-%ED%95%B4%EC%99%B8-%ED%95%99%EC%88%A0%EC%A7%80-%ED%88%AC%EA%B3%A0-%EC%A0%84%EB%9E%B5</link>
            <guid>https://velog.io/@seohyun_nam/CAU-AI%ED%95%B5%EC%8B%AC%EA%B8%B0%EC%88%A0-%EC%84%B8%EB%AF%B8%EB%82%98-%ED%9A%A8%EA%B3%BC%EC%A0%81%EC%9D%B8-%ED%95%B4%EC%99%B8-%ED%95%99%EC%88%A0%EC%A7%80-%ED%88%AC%EA%B3%A0-%EC%A0%84%EB%9E%B5</guid>
            <pubDate>Sat, 15 Nov 2025 13:10:37 GMT</pubDate>
            <description><![CDATA[<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/5fbfd3c1-d78d-4099-b022-d13c80a30513/image.jpg" alt=""></p>
<h2 id="과학적-글쓰기의-5가지-핵심-원칙">과학적 글쓰기의 5가지 핵심 원칙</h2>
<blockquote>
<ol>
<li>독자를 고려할 것</li>
<li>KISS: Keep it short and simple</li>
<li>Story 중심으로 글을 이끌어갈 것</li>
<li>독자의 읽기 패턴을 고려할 것</li>
<li>Title과 Abstract으로 글의 강점을 살릴 것</li>
</ol>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/2843d233-835f-4c82-acdd-e70e0f861e21/image.png" alt=""></p>
<h2 id="가장-중요한-질문">가장 중요한 질문</h2>
<p>&quot;내 글을 읽는 독자는 누구인가?&quot;</p>
<ul>
<li>어디에 쓸것인가?</li>
<li>무엇을, 어떻게 쓸 것인가?</li>
<li>어떻게 스토리를 구성하고 관심을 유도할 것인가?</li>
</ul>
<p><strong><em>독자가 원하는 것 = 당신이 원하는 것</em></strong></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/b077edae-f475-41af-a1da-514d884d7b44/image.png" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/8d8d59ab-a6cd-46d1-b7a3-be41dee28713/image.png" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/ecbffad3-36ce-40a7-8bdb-90d73b7bdb38/image.png" alt=""></p>
<p>여기서 핵심 포인트는 &quot;Keep it short &amp; simple&quot; 개념이다. 간단한 단어와 구문을 사용하고 간단한 문장구조 (능동태)를 사용해야 한다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/a7fa43a5-1ab5-4ad0-9190-58317f8a5d03/image.png" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/7d9c4a6b-777d-488c-8005-3266f14bb792/image.png" alt=""></p>
<h2 id="과학적-글쓰기에서의-스토리텔링">과학적 글쓰기에서의 스토리텔링</h2>
<blockquote>
<ol>
<li>전하고자 하는 이야기의 핵심은 무엇인가?</li>
<li>스토리라인이 명확하고 완성도 있는가?</li>
<li>이 이야기가 과거에도 전달된 적이 있는가?</li>
</ol>
</blockquote>
<h3 id="잘-구성된-스토리의-특성">잘 구성된 스토리의 특성</h3>
<ol>
<li>명확한 줄거리와 메시지 (핵심 메시지, 목적의식)</li>
<li>내용에 알맞은 적절한 길이 (과장 없는 내용, 실질적인 내용 중심)</li>
<li>흐름과 방향성 (우연이나 억지 설정 없는 흐름, 불완전함 또는 한계를 솔직히 표현, 일부 불완전함에도 논리적 일관성/흐름 유지)</li>
<li>결론에 이르는 듯 하다가...</li>
<li>후속 논의나 탐구를 위한 여지를 남김 (독자의 공감, 후속 연구 가능성 시사)</li>
</ol>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/323f0d8d-3bdf-4a5f-9be0-0d1702325a2c/image.png" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/94d93f44-7c7b-41d7-ae3a-56cd530e37c1/image.png" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/8a2057d9-1cbc-43b9-8504-9eee17b3b4f8/image.png" alt=""></p>
<h3 id="제목-최적화">제목 최적화</h3>
<ul>
<li><p>논문 제목 최적화가 중요하다.</p>
</li>
<li><p>좋은 제목이 모든 것을 좌우한다.</p>
</li>
<li><p>인용자의 20%만이 논문 원문을 읽기 때문이다. 
<em>&quot;Read before you cite&quot;. Complex systems 14 (2003) 269-274</em></p>
</li>
<li><p>독자들은 검색엔진/AI를 통해 논문을 검색한다. Google은 논문 제목의 40-60자 / 요약문의 약 160자만 보여준다. </p>
</li>
<li><p>최근에는 AI를 통해 keyword 중심으로 논문을 검색하며, 유명 학술지를 구독해서 간행물 전체를 읽는 사람은 많지 않다.</p>
</li>
</ul>
<h3 id="초록-최적화">초록 최적화</h3>
<p>초록의 기능: 독자가 본문을 빠르고 정확하게 파악하도록 돕는다. 따라서 간단하고, 완전하며, 핵심을 잘 전달해야 한다. 이는 논문이 읽힐지를 결정짓는 주요요소이다. 독자가 가장 먼저 읽은 부분 중 하나이다. 심사자에게 전달되는 정보는 제목과 초록 뿐이다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/684d3987-d610-4cfc-9dab-53c77d98e3c4/image.png" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/b633d84b-67ec-43e6-a0d8-1d8209ab6f1b/image.png" alt=""></p>
<p>여기까지는 오유진 박사님의 강의 내용이였고 논문을 투고하고 Linkedin을 통해 게재한 논문을 홍보하는 것이 필요하다고 말씀해 주셨다. </p>
<p>아래 첨부한 사진은 &quot;중앙대학교 AI대학원 핵심기술 세미나&quot;의 일환으로 진행 되었던 안수남 대표님의 좋은 논문을 작성하기 위해서 알아야할 내용이다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/ff3ed28f-20bc-4fd7-8af1-44521b18b4a4/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/131cb672-4723-45ba-936c-44a6a8a165d4/image.jpg" alt=""></p>
<p>해당 세미나에서 중요하게 말씀하셨던 부분은 Gemini와 Chat GPT가 AI쪽으로는 사전학습이 잘 되어 있기 때문에 활용하면 굉장히 유용하다는 것과 좋은 논문을 쓰기 위해서는 어쩔 수 없이 지속적으로 논문들을 많이 읽어봐야한다는 것이다. </p>
<h3 id="acknowledgment">Acknowledgment</h3>
<p>본 포스팅은 중앙대학교 학술정보원과 WILEY의 &quot;효과적인 해외 학술지 투고 전략&quot;을 주제로한 오유진 박사님의 강의 내용과 AI대학원 CAU-AI 핵심기술 세미나 &quot;AI 기반으로 좋은 논문을 작성하는 방법&quot;을 주제로한 안수남 대표님의 강의 내용에 기반하여 작성되었다.</p>
<h3 id="reference">Reference</h3>
<p><a href="https://scholar.google.com/citations?user=4nnw088AAAAJ&amp;hl=ko&amp;oi=ao">Yujin Oh - Google scholar</a>
<a href="https://onlinelibrary.wiley.com/">https://onlinelibrary.wiley.com/</a>
<a href="https://drive.google.com/file/d/1UY_mSPjdvJ76Kjf3jmzOvSMK5T0_vKTb/view?usp=drive_link">Wiley Education - Certificate</a>
<a href="https://library.cau.ac.kr/">중앙대학교 학술정보원 - homepage</a>
<a href="https://www.linkedin.com/in/shounan-an-95b46ab2/">안수남 대표 - Linkedin</a>
<a href="https://www.murfy.ai/">https://www.murfy.ai/</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[TEAM Naver DAN 25]]></title>
            <link>https://velog.io/@seohyun_nam/TEAM-Naver-DAN-25</link>
            <guid>https://velog.io/@seohyun_nam/TEAM-Naver-DAN-25</guid>
            <pubDate>Sun, 09 Nov 2025 10:42:26 GMT</pubDate>
            <description><![CDATA[<h2 id="연결의-진화-경험의-확장">연결의 진화, 경험의 확장</h2>
<h3 id="keynote-2025년-11월-6일-목-seoul-coex">keynote: 2025년 11월 6일 (목), Seoul Coex</h3>
<blockquote>
<ol>
<li>검색을 넘어 실행까지 사용자 경험의 진화</li>
<li>도구를 넘어 파트너로 비즈니스 에이전트의 시작</li>
<li>입체적 경험이 가능한 컨텐츠 플랫폼</li>
<li>AI, 모두를 위한 도전</li>
</ol>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/c0947590-641b-4fa2-b3e6-99ed0f905d6f/image.jpg" alt="">
네이버는 내년부터 순차적으로 선보인 AI 에이전트를 통해 기업의 정체성을 전면 개편한다. &#39;검색 중심의 플랫폼&#39;에서 벗어나 사용자의 의도를 이해하고 직접 행동을 수행하는 AI 에이전트 플랫폼으로 진화하겠다는 구상이다. 에이전트 N은 온서비스 AI를 통해 축적된 Vertical AI역량을 고도화해 사용자의 맥락을 이해하고 다음 행동을 예측 및 제안하며 실행까지 이어지는 구조롤 만들어졌다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/6b937b4c-69c2-4a5d-955f-2ff9113733e3/image.png" alt=""></p>
<h2 id="agent-n">Agent N</h2>
<p>네이버는 검색부터 실행까지 아우르는 사용자 맟춤형 통합 에이전트 Agent N을 구현한다. 모든 서비스가 유기적으로 연결되는 경험을 제공하고, 사용자의 탐색 과정 속에서 필요한 행동을 제안하는 실행성이 특징이다. 에이전트 N은 네이버의 서비스와 컨텐츠, 데이터를 하나로 통합한 사용자 개개인을 위한 맞춤형 통합 에이전트이다. 내년부터 검색, 쇼핑에 AI agent를 본격으로 도입해 사용자 이해를 바탕으로 행동에 더욱 적극적으로 개입하는 통합 대리인 Agent N을 통해 서비스 경험을 혁신할 계획이다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/28b663de-fb66-4d18-bd28-9883bc0266db/image.png" alt=""></p>
<p>2000년대 후반 모바일의 전환기에 local, 개인화, 인포테인먼트 영역에서 사용자 중심의 서비스를 선보였던 네이버는 이번 행사를 통해 AI 대전환의 흐름 속에서 전 서비스의 &#39;에이전트화&#39;를 추진한다. 이번 키노트세션에서는 네이버가 AI기술로 사용자의 관심과 행동 흐름을 학습해 자연스러운 연결을 실현하는데에 주력하였고, 에이전트 N은 그간 네이버가 On-service AI로 만들어낸 경험을 바탕으로 네이버의 모든 서비스와 컨텐츠를 결합한 통합 에이전트라고 설명했다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/5e511e7b-6fa3-43fc-8255-eaff05cd768e/image.png" alt=""></p>
<h2 id="검색을-넘어-실행까지-사용자-경험의-진화">검색을 넘어 실행까지: 사용자 경험의 진화</h2>
<p>에이전트 N은 네이버의 모든 서비스가 &#39;하나의 서비스&#39;처럼 유기적으로 연결되는 &#39;심리스한 경험&#39;을 구현한다. 사용자가 직접 명령을 입력하지 않아도 지도, 캘린더, 예약, 컨텐츠 등 네이버의 다양한 서비스가 사용자의 탐색과정속에 자연스럽게 녹아 들어 필요할 때 제안하고 실행한다. 또한 데이터의 결합이 정교한 &#39;초개인화&#39;를 가능하게 한다. 네이버는 초거대 언어모델 기술을 활용해 다양한 서비스 로그를 통합 분석, 사용자의 행동을 예측하고 이에 맞는 제안을 수행한다.
사용자의 관심사와 패턴을 종합적으로 이해해 &#39;페르소나&#39;를 구축하고 여기에 기반해 가장 적합한 정보와 엑션을 제시하는 방법이다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/ea9684dd-4527-4cd1-8dd3-884e7090ce96/image.png" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/d6c81941-2e1d-41b4-9893-ac0f477a882b/image.jpg" alt=""></p>
<p>따라서 단순한 추천이나 제안을 넘어 실제 행동까지 연결할 수 있는 실행형 에이전트를 지향한다는 것이다. 에이전트 N은 부동산, 캘린더, 블로그, 카페, 네이버플러스스토어 등 네이버 생태계 내 이용자 행동 데이터를 기반으로 한다. 내년여름 출시예정인 신규 서비스 AI 탭의 예를 들어보겠다.</p>
<blockquote>
<p>AI탭에서 &#39;초보자 러닝코스&#39;를 입력하면 플레이스, 카페, 블로그 데이터를 기반으로 관련 코스와 후기 정보를 보여주고, 러닝 인플루언서를 구독하거나 체온 유지에 좋은 윈드브레기커 등 개인화된 상품을 탐색, 구매할 수 있다. </p>
</blockquote>
<p>이때, 구매과정에는 &#39;쇼핑 에이전트&#39;가 연동된다. </p>
<p>AI agent의 경쟁력의 핵심은 신뢰성 있는 데이터로, 네이버는 이를 위해서 &#39;메타데이터&#39;를 활용해 에이전트가 참조하고 이용하는 데이터의 신뢰성을 확보하겠다는 계획이다. 메타데이터의 정의는 데이터의 생산,유통,소비과정에서 생성되는 데이터를 설명하는 데이터로 단순히 크롤링만으로는 얻기 쉽지 않다. 이를 통해서 AI가 참고하는 컨텐츠가 실제 사용자의 경험기반인지, 혹은 자동 생성된 데이터인지를 판별가능하다. </p>
<p>B2B 분야에서는 풀스택 AI역량을 기반으로 반도체,조선,방산, 바이오 등 한국을 이끄는 산업들의 AX를 주도한다. 기반이 될 인프라 구축을 위해 내년 중 GPU에만 1조원 이상을 투자한다. 이를 통해 대한민국을 AI 3대 강국으로 도약시키는데 최선을 다하겠다는 방침이다. Physical AI를 구현하기 위해 국내 최대, 최고수준의 인프라를 목표로 AI 생태계 경쟁력을 위한 데이터센터와 컴퓨팅 투자를 적극적으로 확대한다. 네이버 사옥 1784와 각 세종 데이터센터를 연결하는 physical AI의 테스트 베드가 본격적으로 운영된다. 네이버 클라우드는 이같은 기술과 인프라를 기반으로 산업 특화 AI 생태계를 확장해나간다. 조선, 에너지, 바이오 등 주요 산업기업과 협력해 AI기반 공정 운영, 설비관리, 품질 예측 등 제조 전과정에서의 AI활용을 지원한다. 또한 산업 현장에 최적화된 기술이 빠르게 자리잡을 수 있도록 지원을 해나갈 예정이다. 피지컬 AI의 하드웨어 부분 중 하나인 로봇 가운데 MIT와 협력해서 개발하고 있는 소형 휴머노이드 로봇 &#39;미니노이드&#39;또한 공개되었다. 아래 사진속 네이버의 로봇 클라우드 &#39;아크&#39;와 웹기반 로봇 운영체제(OS) &#39;아크 마인드&#39;를 통해서 구동이 된다. 로봇 OS 및 제어 플랫폼또한 최고 수준의 역량을 가지고 신성장 동력을 확보할 수 있을 것이라고 자신했다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/cbc0fb55-16a7-4495-af48-454942debb5c/image.jpg" alt=""></p>
<h2 id="도구를-넘어-파트너로-비즈니스-에이전트의-시작">도구를 넘어 파트너로: 비즈니스 에이전트의 시작</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/40302d6c-c344-4168-ab6f-5d1044c4fd09/image.png" alt=""></p>
<p>더불어 에이전트 N을 개인부터 기업까지 아우르도록 확장할 계획으로 내년 비즈니스 통합 에이전트 &#39;에이전트 B for 비즈니스&#39;를 선보일 예정인데, 쇼핑, 광고, 플레이스 등 전 사업자를 위한 AI 솔루션으로 사업자가 AI로 사업환경과 현황, 개선사항을 분석하는 형태이다. 네이버는 실구매자, 실예약자만 작성 가능한 리뷰, POS 시스템과 연동된 실시간 예약 현황, 판매자와 직접 연결된 재고 정보 등 신뢰성 높은 데이터를 확보하고 있다. 해당 서비스는 쇼핑, 광고, 플레이스 등 모든 사업자들을 위한 AI solution으로 그동안 분산되어 있던 사업자 솔루션과 데이터를 하나의 비즈니스 허브로 통합해 사업자가  AI를 기반으로 비즈니스환경을 분석하고 상황을 진단, 개선하는데 도움을 준다는게 회사의 설명이다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/39a5cd0e-fc30-4bd9-b8bf-9b61627f8951/image.png" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/39a18fe7-6185-43a0-8cee-6d55ca814be1/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/99191e39-1632-467a-b477-93a97de31718/image.jpg" alt=""></p>
<h3 id="reference">Reference</h3>
<p><a href="https://dan.naver.com/25">https://dan.naver.com/25</a>
<a href="https://zdnet.co.kr/view/?no=20251106093818">https://zdnet.co.kr/view/?no=20251106093818</a>
<a href="https://zdnet.co.kr/view/?no=20251106152756">https://zdnet.co.kr/view/?no=20251106152756</a>
<a href="https://n.news.naver.com/article/092/0002397366?cds=news_my_20s">https://n.news.naver.com/article/092/0002397366?cds=news_my_20s</a>
<a href="https://n.news.naver.com/article/018/0006158033?cds=news_my_20s">https://n.news.naver.com/article/018/0006158033?cds=news_my_20s</a>
<a href="https://n.news.naver.com/article/031/0000978689?cds=news_my_20s">https://n.news.naver.com/article/031/0000978689?cds=news_my_20s</a>
<a href="https://n.news.naver.com/article/119/0003021857?cds=news_my_20s">https://n.news.naver.com/article/119/0003021857?cds=news_my_20s</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Upstage AI Space: AI for document-based work]]></title>
            <link>https://velog.io/@seohyun_nam/Upstage-AI-Space-AI-for-document-based-work</link>
            <guid>https://velog.io/@seohyun_nam/Upstage-AI-Space-AI-for-document-based-work</guid>
            <pubDate>Sun, 26 Oct 2025 09:44:05 GMT</pubDate>
            <description><![CDATA[<p>오늘은 Upstage에서 제공하는 AI Space에 대해서 글을 적어보려고 한다.</p>
<p>홈페이지에 접속에서 상단 메뉴 중 &quot;Products&quot;를 클릭하면 Generative intelligence, Document intelligence, Intelligence spaces 세가지가 있는데 이중에서 AI Space는 The command center for teams buried in paperwork라고 부연설명되어 있다. </p>
<h2 id="upstage-ai-space">Upstage AI Space</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/237458ba-56fc-4684-9922-2f9b0227a9b7/image.jpg" alt=""></p>
<p>Upstage AI space에서는 다음과 같은 기능들을 제공한다. 내가 직접 활용해본 예시는 아래에 첨부하도록 하겠다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/474cfc10-6f2e-4da1-821f-17ad3223a920/image.jpg" alt=""></p>
<p>먼저 아래 캡쳐화면을 보면, 상단 왼쪽의 new project의 경우 다양한 경로를 통해 문서를 받아올 수 있다. local 환경에 저장되어 있는 파일, 혹은 google drive, gmail을 연동하거나  외부 URL link를 통해서 데이터를 불러오는 것이 AI Space에서 가능하다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/88a171bf-e220-4767-963b-b19431fdacd8/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/3187741e-080f-47a6-b792-cd768032ffc4/image.jpg" alt="">
나의 경우, 구글 드라이브에 저장되어 있던 논문을 불러와 봤는데, 일단 해당 기능을 사용하기 위해 클릭하면, 위에 캡쳐 사진처럼, Link google drive account라는 창이 뜨게 되고 이후 Connect 버튼을 누르면, 내 구글 계정에 저장되어 있는 파일들을 AI Space에 불러오는 것이 가능해진다. </p>
<h2 id="what-you-can-do">What you can do</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/2d91f75f-076c-4e8c-bde1-5df7395c1f9b/image.jpg" alt=""></p>
<p>그렇다면 AI Space를 활용하면 어떠한 기능들을 구체적으로 사용해 볼 수 있을까?
Upstage homepage에 나와있는 공식 설명은 아래와 같다. </p>
<blockquote>
<p>Document Chat: Ask natural-language questions and get accurate, source cited answers
Information Extraction: Pull structured data from invoices, forms and reports using plain language
Summarization: Generate clear overviews from long or complex documents
Compliance Check: Validate that each document meets required formats and content rules-flag non-compliant sections with citations
Document Comparison: Identify version changes across policies, contracts, Invoices, and clinical guidelines</p>
</blockquote>
<h2 id="usability">Usability</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/c18d2a35-cc62-44bd-9dfc-4d82c60301e3/image.jpg" alt="">
Upstage AI space는 위에 &quot;Built for your industry&quot;를 확인해 보면 알 수 있듯이, 보험, 금융, 제조업 등 여러 비즈니스 환경에서 활용 가능한 서비스이며 위와 같은 기능들을 제공한다. 더불어 업로드 되는 모든 문서, 채팅 내용, 도출된 결과물들은 HIPAA, ISO 27001, SOC 2의 철저한 enterprise-grade 보안 인증에 의해 개인정보가 보호된다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/7f636199-df6f-47f7-8baf-ef5b75e33f08/image.jpg" alt=""></p>
<p>나는 6개의 파일들을 업로드 해보았고, Solar Pro 2 model에게 해당 문서에 관해 simple Question &amp; Answering task를 진행해 보았다. 위에서 언급한 바와 같이, Upstage AI space는 자연어로 질의를 하면 거기에 맞는 근거를 제공한다. 왼쪽 문서에 보라색으로 해당 영역에 표시가 되기 때문에 내가 필요한 특정 부분에 정보를 쉽고 빠르게 찾을 수 있다. 또한 상단에 HTML 버튼을 클릭하면, Document structure를 HTML format으로 변환하는 기능도 제공한다. 더불어, Solar chat 하단에는 information extraction 기능도 제공하는데, 이를 활용하기 위해서는 우선적으로 해당 문서에 대한 schema가 필요하다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/e0ad857e-d57f-4cb1-88e1-49216344a717/image.jpg" alt=""><img src="https://velog.velcdn.com/images/seohyun_nam/post/aa8e20c6-1e2d-463a-82a0-80689563e0a8/image.jpg" alt=""></p>
<h2 id="advantages-of-using-upstage-information-extract">Advantages of using Upstage information extract</h2>
<p>Information extraction의 &quot;set schema&quot; 부분에 대해서는 &quot;Upstage official tech blog&quot;의 글을 참고하여 구체적으로 설명해보도록 하겠다. </p>
<p>예를 들어, 보험 업계의 경우 지난 분기까지만 해도 보험 서류에 47개 항목이 있었는데 이번 분기엔 63개로 늘어나고, 다음 분기엔 또 달라진다. 매번 새 상품이 출시되고 규제가 바뀌며, 기업이 합병되면 용어나 데이터 구조가 순식간에 바뀐다.
여기서 문제는 대부분의 문서 자동화 시스템이 이런 변화를 전제로 설계되지 않았다는 점이다. 대부분의 시스템은 ‘한 번 구축하면 끝’이라는 방식으로 만들어져 있어서, 필드나 구조가 조금만 달라져도 전체 logic이 깨진다. 그때마다 IT팀은 시스템을 다시 수정하고, 운영팀은 기다리며, 그 사이에 문서 처리가 멈춘다. 결국 자동화가 중단되고 다시 수작업이 늘어난다.</p>
<p>Ontology는 IT 스프린트보다 훨씬 빠르게 변하지만, Automation는 그 속도를 따라가지 못한다. 지금 필요한 것은 단순한 자동화가 아니고, 변화를 견딜 수 있는 자동화 따라서, 온톨로지가 바뀌어도 멈추지 않는 시스템이 필요하다. Upstage information extract 는 데이터 구조가 바뀌는 순간에도 스스로 적응할 수 있는 추출 시스템을 활용한다. 즉, Ontology가 변하더라도, 변화에 흔들리지 않는 자동화가 핵심 차별화 포인트가 된다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/511a4279-9dd3-4bfe-aa50-52a395b3fbc1/image.jpg" alt=""></p>
<p>Upstage의 핵심은 스키마를 학습된 모델이 아닌 설정으로 다루는 것이다. 새로운 필드를 추가하거나 설명을 수정해도 모델을 다시 학습시킬 필요가 없다. 보험 서류 항목이 47개에서 63개로 늘어나더라도 스키마만 업데이트하면 된다. 재학습도, 긴 IT 스프린트도 필요하지 않다.</p>
<p>문서 10개만 업로드하면 AI가 자동으로 스키마를 제안하고, 검토 후 바로 배포할 수 있다. 약 3분이면 끝난다. 초기 정확도는 약 80% 수준으로 충분히 실무에 쓸 수 있다. 새로운 용어가 생기면 2~3개의 예시만 추가해주면 된다. 내부 테스트에서는 이런 방식으로 평균 6.65% 정확도가 향상됐다. 더불어 검증 기능도 내장하고 있다. 신뢰도가 낮은 값은 자동으로 표시되어 검토 대상임을 알려주고, 추출된 값이 원본 문서의 어느 페이지, 어느 좌표에서 나왔는지도 바로 확인할 수 있다. 검토 중 발견된 오류는 피드백되어 스키마를 자동으로 개선한다. PDF든, 스캔 문서든, 입력 형식이 달라도 문제되지 않는다. 모든 문서는 Document Parse를 통해 표준화되어, 형식이 바뀌어도 추출 로직이 깨지지 않는다.</p>
<p>만약 밤새 50개의 새 필드가 추가되더라도 복잡하지 않다. 스키마를 업데이트하고, 샘플 배치를 검증한 뒤 배포하면 된다. 몇 분이면 끝난다. 두가지 시나리오 예시를 통해 이 시스템이 이러한 문제 발생상황에서 어떻게 대응 가능한지 설명하도록 하겠다.</p>
<h3 id="scenario-1-new-insurance-product-launch">Scenario 1: New insurance product launch</h3>
<blockquote>
<p>보험사가 새 상품을 출시하면서 신청서 양식이 바뀌었다.
기존엔 47개의 필드였지만, 새 상품에는 63개의 필드가 필요하다.
문제는 기존 시스템이 새 필드를 인식하지 못해 신청서를 처리할 수 없다는 점이다.
금요일 출시를 앞두고 이미 수천 건의 신청서가 접수된 상태다.
일반적인 시스템이라면 모델을 다시 학습시키고 코드를 수정해야 하지만, Upstage에서는 스키마만 수정하면 된다. 즉, 새 필드 16개를 추가하고 검증한 뒤 바로 배포할 수 있다. 따라서 몇 분 만에 새 상품 양식을 반영하고 업무를 이어가능 것이 가능하다.</p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/adcf4b01-6624-43e5-aba3-f20f2de74a67/image.jpg" alt=""></p>
<h3 id="scenario-2-regulatory-compliance-update">Scenario 2: Regulatory compliance update</h3>
<blockquote>
<p>새로운 개인정보 보호 규제가 즉시 시행되었다.
기존에는 ‘환자 동의’ 항목 하나만 있었지만, 이제는 ‘치료 동의’, ‘데이터 공유 동의’, ‘연구 동의’ 세 항목으로 나뉘어야 한다. 기존 시스템은 하나의 값을 추출하도록 설계되어 있어 법적으로 바로 위반 상태가 된다. Upstage에서는 필드 구조를 세 개로 나누는 스키마 변경만 하면 된다. 모델을 다시 학습할 필요 없이, 새 규제를 반영한 스키마를 바로 배포할 수 있다. 이를 통해 당일 안에 법적 요건을 충족하고, 업무를 멈추지 않고 지속할 수 있게된다.</p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/00e76552-a2eb-4dec-93f0-850a27bf6807/image.jpg" alt=""></p>
<h3 id="reference">Reference</h3>
<p><a href="https://www.upstage.ai/blog/en/when-ontology-moves-faster-than-it?utm_source=text-link&amp;utm_medium=web-blog-en&amp;utm_campaign=information-extract">When Ontology Changes Faster Than IT: Upstage - tech blog</a>
<a href="https://console.upstage.ai/docs/getting-started">Upstage console</a>
<a href="https://www.upstage.ai/products/ai-space">Upstage AI Space</a>
<a href="https://www.upstage.ai/">Upstage - homepage</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Attention으로 이어진 딥러닝 진화의 계보: Word2Vec to Transformers]]></title>
            <link>https://velog.io/@seohyun_nam/Attention%EC%9C%BC%EB%A1%9C-%EC%9D%B4%EC%96%B4%EC%A7%84-%EB%94%A5%EB%9F%AC%EB%8B%9D-%EC%A7%84%ED%99%94%EC%9D%98-%EA%B3%84%EB%B3%B4-Word2Vec-to-Transformers</link>
            <guid>https://velog.io/@seohyun_nam/Attention%EC%9C%BC%EB%A1%9C-%EC%9D%B4%EC%96%B4%EC%A7%84-%EB%94%A5%EB%9F%AC%EB%8B%9D-%EC%A7%84%ED%99%94%EC%9D%98-%EA%B3%84%EB%B3%B4-Word2Vec-to-Transformers</guid>
            <pubDate>Mon, 20 Oct 2025 10:26:29 GMT</pubDate>
            <description><![CDATA[<h2 id="1-단어를-숫자로-이해하기-시작하다--word2vec">1. 단어를 숫자로 이해하기 시작하다 — Word2Vec</h2>
<p>딥러닝 이전의 자연어 처리는 단어를 하나의 기호로만 봤다.
Bag-of-Words나 TF-IDF는 단어의 의미나 순서를 몰랐다. </p>
<blockquote>
<p>예를 들어 “king”과 “queen”은 완전히 다른 차원의 벡터였다.</p>
</blockquote>
<p>2013년, 구글의 Tomas Mikolov이 제안한 Word2Vec은 단어를 고정된 벡터 공간의 점으로 매핑함으로써 의미적으로 비슷한 단어는 가까이 위치하도록 학습시켰다.</p>
<p>CBOW는 주변 단어로 중심 단어를 예측하고,
Skip-gram은 중심 단어로 주변 단어를 예측한다.
이 단순한 아이디어로 Word2Vec은 단어 의미의 연속성(king – man + woman ≈ queen) 을 포착했다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/3494bacd-50ef-4026-af32-bfa23d5d323e/image.jpg" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/40bc9775-8b57-416e-8862-7b6445cd924e/image.jpg" alt=""></p>
<p>하지만 이 모델은 고정된 window 안에서만 학습하기 때문에 문장 전체의 흐름이나 순서, 장거리 문맥을 파악하지 못한다는 한계가 있었다.</p>
<h2 id="2-순서를-기억하게-하다--rnn--lstm">2. 순서를 기억하게 하다 — RNN &amp; LSTM</h2>
<p>단어의 순서를 이해하기 위해 Recurrent Neural Network(RNN)이 등장했다.
RNN은 이전 단어의 정보를 hidden state에 저장하고, 다음 입력에 전달하여 시퀀스 데이터(sequential data)를 단계적으로 처리한다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/5efe4c44-6536-4307-9acc-17ebcc5ca198/image.jpg" alt=""></p>
<p>그러나 문장이 길어질수록 과거의 정보가 희미해지는 Gradient Vanishing 문제가 발생했다.
이를 해결하기 위해 LSTM(Long Short-Term Memory)과 GRU가 제안되었다. 이들은 게이트(gate)를 사용해 정보를 선택적으로 기억하거나 잊는다.</p>
<blockquote>
<p>덕분에 “I grew up in France … I speak fluent ___” 문장에서
‘French’를 예측할 수 있을 정도로 장기 의존성을 다룰 수 있게 됐다.</p>
</blockquote>
<p>하지만 여전히 순차적 계산으로 병렬화가 어렵다는 근본적 한계가 있었다. 즉, 긴 문장을 처리하려면 시간이 너무 오래 걸렸다.</p>
<h2 id="3-한눈에-보는-주의집중--seq2seq--attention">3. 한눈에 보는 주의집중 — Seq2Seq &amp; Attention</h2>
<p>2014년, Google Brain의 Bahdanau와 Luong 연구팀은 Encoder–Decoder 구조에 Attention 메커니즘을 도입했다. 기존 Seq2Seq는 입력 문장을 하나의 고정된 벡터로 요약했기 때문에 문장이 길면 정보 손실이 심했다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/85f5f2f5-30d7-42ce-87db-2590d1ec9ea4/image.jpg" alt=""></p>
<p>Attention은 Decoder가 단어를 생성할 때마다 입력 문장 전체에서 어디를 더 봐야 하는지를 계산하게 했다. 이 덕분에 모델은 긴 문장에서도 필요한 부분에 집중할 수 있었다.</p>
<blockquote>
<p>예를 들어 “Je t’aime”를 “I love you”로 번역할 때, 각 출력 단어가 대응되는 입력 단어에 주의를 기울이는 방식이다.</p>
</blockquote>
<p>Attention은 단순히 도움이 되는 기능을 넘어, 이후 모든 딥러닝 구조의 중심 사상으로 자리 잡는다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/b60cf5a0-201a-415b-9676-135a86bde854/image.jpg" alt=""></p>
<h2 id="4-순서를-버리고-관계를-보다--transformers">4. 순서를 버리고 관계를 보다 — Transformers</h2>
<p>“Attention Is All You Need.” 이 한 문장으로 정리되는 2017년의 혁신.<img src="https://velog.velcdn.com/images/seohyun_nam/post/4e95f67f-93db-4a2b-beda-85f79610a073/image.jpg" alt=""></p>
<p>Vaswani et al.은 RNN의 순차성을 완전히 제거했다. Transformer는 모든 단어가 Self-Attention을 통해 서로의 관계를 한 번에 계산한다.</p>
<p>Query, Key, Value로 이루어진 Attention 구조는 각 단어가 문맥 속에서 얼마나 중요한지를 수치적으로 학습한다.<img src="https://velog.velcdn.com/images/seohyun_nam/post/2e0d009c-dfb4-4060-94b2-461b9342351f/image.jpg" alt=""></p>
<p>Multi-Head Attention은 서로 다른 의미적 관계를 병렬적으로 탐색한다. Positional Encoding은 순서 정보를 보완한다.</p>
<p>그 결과, RNN보다 훨씬 빠르고 정확하며 병렬화가 가능한 모델이 탄생했다. 이 아이디어는 이후 모든 대형 언어모델(BERT, GPT, T5)의 근간이 된다. 일반적으로 Transformer의 encoder부분만 활용하는 BERT는 텍스트를 &quot;이해&quot; 하는데, Transformer의 decoder부분만을 활용하는 GPT의 경우 텍스트를 &quot;생성&quot; 하는데 강점이 있다고 알려져 있다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/f9d9a5dc-8911-4ed7-8b0f-a7448a38a132/image.jpg" alt=""></p>
<h2 id="5-시각의-세계로의-확장--vision-transformers--detr">5. 시각의 세계로의 확장 — Vision Transformers &amp; DETR</h2>
<p>Transformer의 전역 Attention 개념은 언어를 넘어 이미지로 확장되었다. ViT(Vision Transformer)는 이미지를 패치 단위로 나누어 단어처럼 처리했다. DETR(Detection Transformer) 는 기존 Object Detection의 복잡한 구조를 단순화했다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/5bc7223d-946f-40d8-9fdb-b8e6c8d1cf98/image.jpg" alt=""></p>
<p>기존 Faster R-CNN은 Region Proposal → Feature Extraction → Classification 의 다단계 과정을 거쳤지만, DETR은 Transformer Decoder의 Object Query가 직접 객체를 1:1로 예측하는 Set Prediction Problem으로 정의했다.</p>
<p>이 덕분에 NMS(Non-Max Suppression)같은 후처리가 사라지고, 탐지 과정 전체가 End-to-End로 통합되었다.</p>
<p>다만 작은 객체나 세밀한 경계 탐지에는 여전히 약하다는 단점이 있다.</p>
<h2 id="6-현실을-창조하는-모델--gan--diffusion-model">6. 현실을 창조하는 모델 — GAN &amp; Diffusion model</h2>
<p>같은 시기, 생성 모델 분야에서는 GAN(Generative Adversarial Network)이 세상을 바꿨다.
Generator는 가짜 이미지를 만들고, Discriminator는 이를 구분하며 서로 경쟁적으로 학습한다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/bf1d95de-9211-46f0-b534-2cda295c45b2/image.jpg" alt=""></p>
<p>GAN은 데이터를 직접 생성하는 딥러닝이라는 새로운 패러다임을 열었다. 그러나 학습이 불안정하고, 특정 패턴만 생성하는 Mode Collapse 문제가 있었다.</p>
<p>최근에는 이를 보완한 Diffusion Model(Stable Diffusion, Imagen)이 주류가 되었다.
Transformer 기반 텍스트 인식과 결합하여 텍스트에서 이미지로 (text-to-image) 생성하는 시대를 열었다.</p>
<h2 id="7-거대한-통합--gpt--rag">7. 거대한 통합 — GPT &amp; RAG</h2>
<p>Transformer 이후의 모델들은 단순한 구조 개선이 아니라 범용성을 추구한다.
GPT 시리즈는 Self-Attention을 이용한 자동회귀 언어모델로, 거대한 사전학습 데이터에서 패턴을 학습한다.</p>
<p>T5(Text-to-Text Transfer Transformer) 는 모든 문제를 “입력 텍스트 → 출력 텍스트”로 통일해
번역, 요약, 질의응답을 한 모델로 수행하게 했다.</p>
<p>RAG(Retrieval-Augmented Generation)은 Transformer 기반 생성모델에 검색(Retrieval)기능을 결합해 모델이 스스로 외부 지식을 참조하도록 진화했다.
이 개념은 ChatGPT, Gemini, Claude 같은 현대 LLM의 핵심 구조로 이어진다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/0b540734-12f0-4d2e-b5e8-f1e494f2585e/image.jpg" alt=""></p>
<blockquote>
<p>딥러닝의 발전은 결국 한계의 인식 → 구조적 재해석 → 전이와 확장의 연속이다.</p>
</blockquote>
<p>Word2Vec은 단어 의미를 “숫자”로 표현하려 했고,
RNN은 “순서”를 기억하려 했으며,
Transformer는 “관계”를 전부 모델링하려 했다.
그 뒤 DETR과 GAN은 “시각과 생성”으로 확장했고,</p>
<blockquote>
<h3 id="오늘날-gpt는-이-모든-걸-통합하는-언어적-사고의-틀로-작동한다">오늘날 GPT는 이 모든 걸 통합하는 언어적 사고의 틀로 작동한다.</h3>
</blockquote>
<h2 id="acknowledgment">Acknowledgment</h2>
<p>이번 포스팅은 중앙대학교 소프트웨어학부 김범수 교수님의 수업자료에 기반하여 작성되었음을 분명히 명시하며 좋은 수업내용을 들을 수 있어 감사한 마음을 전해드리고 싶다. 더불어, 첨부된 그림들의 자세한 설명을 학습하고 싶다면, 아래 Reference에 원문 논문들을 첨부해두었으니, 찾아서 읽어보길 권한다. 
<a href="https://bmsookim.github.io/">https://bmsookim.github.io/</a></p>
<h3 id="reference">Reference</h3>
<p>Attention is all you need (2017, Vaswani et al)
Efficient estimation of word representations in vector space (2013)
Retrieval-augmented generation for knowledge intensive NLP tasks (NeurIPs’20)
attention-based Dropout Layer for Weakly Supervised Object Localization (CVPR)
Rich feature hierarchies for accurate object detection and semantic segmentation tech report (Ross Girshick et al, UC Berkeley)
Fast R-CNN (Ross Girshich, Microsoft Research)
Faster R-CNN: Towards real-time object detection with region proposal networks (Shaoqing Ren, et al)
Focal loss for dense object detection (Facebook AI research)
Mask R-CNN (Facebook AI research, Kaiming He - MIT)
End-to-End object detection with transformers (Facebook AI)
Generative Adversarial Nets (Ian J. Goodfellow et al)</p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Building n8n workflow using Upstage Solar Pro 2]]></title>
            <link>https://velog.io/@seohyun_nam/Building-n8n-workflow-using-Upstage-Solar-Pro-2</link>
            <guid>https://velog.io/@seohyun_nam/Building-n8n-workflow-using-Upstage-Solar-Pro-2</guid>
            <pubDate>Sun, 12 Oct 2025 08:17:15 GMT</pubDate>
            <description><![CDATA[<p>나는 나만의 아이디어를 활용하여, Upstage에서 제공하는 LLM 모델을 사용하여 2가지 n8n Workflow를 제작해 보았다.</p>
<blockquote>
<ol>
<li>HTTP Request로 Open Access로되어있는 논문 PDF를 받아 이에 대한 내용을 Upstage Solar LLM에게 질의응답이 가능한 워크플로우</li>
<li>Solar Chat Model을 활용한 simple Question &amp; Answering Chatting AI Agent</li>
</ol>
</blockquote>
<p>내가 이를 어떻게 만들었는지 처음부터 단계적으로 설명하도록 하겠다.</p>
<h2 id="n8n-설치">n8n 설치</h2>
<p>먼저 n8n을 실행하여야 한다. NPX를 이용한 간단한 설치, Node.js만 설치되어 있다면 몇분만에 실행할 수 있는 가장 간단한 방법, Docker를 이용한 설치, 크게 방법이 2가지 있는데 이중 나는 Docker로 이미지를 pull한뒤, 이를 실행하였다.
Container name은 내 마음대로 지정하면 된다. 나는 &quot;seohyun&quot;으로 지정하였고 아래 Run을 클릭하여 다음 단계로 진행하였다.<img src="https://velog.velcdn.com/images/seohyun_nam/post/df460596-56c2-4634-beea-f24a803be65e/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/2487993b-41e8-4cce-9e87-e9858d6894a8/image.jpg" alt=""></p>
<p>이렇게 되면, 이제 local에서 실행이 가능한 상태가 되어 다음 작업을 할 수 있게 된다. n8n을 처음 접속하는 이용자라면, 관리자 설정 및 license를 활성화해야 한다. 즉, 이름, 이메일, 비밀번호를 사용하여 관리자 계정을 생성하는 초기 admin setting을 해야하고, license key를 요청하여 이를 activation key에 입력해야 n8n의 모든 기능을 자유롭게 사용할 수 있다. <img src="https://velog.velcdn.com/images/seohyun_nam/post/adfe5cb3-1df8-4bfb-a2e9-df54a783f998/image.jpg" alt=""></p>
<h2 id="upstage-api-사용법">Upstage API 사용법</h2>
<p>Upstage API를 사용하는 방법도 2가지가 있는데, 하나는 HTTP Request 방식, 두번째는 Community Node 방식이다. 첫번째 HTTP Request 방식은 직접 API를 호출하고, 세밀한 제어가 가능하다는 장점이 있지만, 복잡한 설정이 필요하다는 단점이 있다. Community Node 방식으로는 API key 관리를 자동화하는 Credential, 최적모델 사전 선택, 검증된 기본값 적용하는 parameter, 오류 처리를 내장할 수 있는 Error Handling의 미리 최적화되어 있는 세팅된 설정 옵션들이 있다. 이는 개발시간을 80% 이상 절약하고, 복잡한 API 문서 학습의 불필요, 즉시 사용 가능한 완성형 도구로서 사용가능하다는 장점이 있다. </p>
<p>나의 경우, n8n community node를 설치하여 Upstage API를 사용하였다. <img src="https://velog.velcdn.com/images/seohyun_nam/post/8d767a72-39ae-4abe-a2e8-6bdca5c40884/image.jpg" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/a42b097a-3b91-40d0-a914-3ed4b242cd38/image.jpg" alt="">
위와 같은 창이 떳다면, Community node가 최종적으로 설치되었다는 의미이고, 이제 Upstage에서 제공하는 모든 제품들을 n8n에서 활용할 수 있게 된다. </p>
<h2 id="1-pdf-qa-workflow">1. PDF Q&amp;A Workflow</h2>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/2e0078f4-c445-44ad-970b-ac75a039ecb0/image.jpg" alt=""></p>
<p>앞서 설명했듯이, 나는 2가지의 workflow를 제작해 보았다. 먼저, 첫번째 워크플로는 HTTP Request를 사용해 .pdf 형식의 파일을 받아 Solar LLM에게 질문하여 이에대한 답변을 받는 것이다. HTTP Request는 restapi 기능을 제공한다. <img src="https://velog.velcdn.com/images/seohyun_nam/post/3481c7cd-c17e-4c14-b37c-8c2db1ca3b56/image.jpg" alt=""> 위에 보이는 사진은 HTTP Request node의 parameters 설정 모습이다. 나는 Web에서 공개되어 있는 .pdf 파일확장자를 HTTP의 GET Method를 사용해서 &quot;file&quot;로 불러왔다.<img src="https://velog.velcdn.com/images/seohyun_nam/post/315787a7-3059-4149-839f-625067b390e6/image.jpg" alt=""> Solar LLM model은 위 캡쳐화면에서 보다싶이, solar-mini, solar-pro, solar-pro2 3가지 중에서 하나를 선택하면 되는데, 나는 solar-pro2를 사용하였다. 아래는 해당 워크플로우를 실행한 모습이다. 상단의 INPUT에는 Schema, Table, JSON, Binary 4가지 형식을 선택할 수 있고, 오른쪽에 OUTPUT 출력화면을 보면 Schema, Table, JSON 형태로 결과값을 볼 수 있다. 앞서 내가 언급했듯이, 나는 HTTP Request를 통해서 논문.pdf 형식의 파일을 불러왔기 때문에, Upstage Solar LLM에 &quot;이 논문의 핵심 기여가 뭐야?&quot; 라는 질문을 해보았고 이에 대한 답을 LLM model이 해준 모습이다. 번외로, &quot;Role&quot; 설정 또한 가능하다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/d102de4b-4351-4b70-b927-7f46bba99906/image.jpg" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/1b38f5f6-2da2-4f46-88e4-5da26ed86bdc/image.jpg" alt=""> </p>
<h2 id="2-chatting-agent-workflow">2. Chatting Agent Workflow</h2>
<p> <img src="https://velog.velcdn.com/images/seohyun_nam/post/c98707bb-85b0-4af2-a5b5-f6514372bdbd/image.jpg" alt=""></p>
<p> 내가 제작한 두번째 Workflow는 Solar Chat Model을 활용한 AI Agent이다. Model들을 아래 처럼 8개의 모델 중 하나를 선택할 수 있다. 이번에는 solar-pro 모델을 선택하여 작업을 진행해 보았다. </p>
<p> <img src="https://velog.velcdn.com/images/seohyun_nam/post/cc7d388c-e96c-4819-8f21-1a0ca5984e9a/image.jpg" alt=""></p>
<p>아래 캡쳐화면 처럼, Solar model에 &quot;안녕&quot; 이라고 입력해보았다. 그림에서 확인할 수 있듯이, Logs에 process가 다 입력이 되고, Input, Output이 출력됨을 볼 수 있다. </p>
<p> <img src="https://velog.velcdn.com/images/seohyun_nam/post/7a122277-fb2e-4aac-b4a6-ad3acf9ebe64/image.jpg" alt="">
 더불어 Solar Chat Model 노드를 상세 클릭하여 Parameter와 setting창에 들어가면, 다시 아래 화면처럼, 입력과 출력값을 Schema, Table, JSON 형태로 출력가능하다는 것을 확인할 수 있다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/543e3a7f-ce53-4680-a871-dc7d79c64286/image.jpg" alt=""></p>
<p>마지막으로, 아래 화면에서 Solar Model에게 직접 &quot;Solar model에 대해서 어떻게 생각해?&quot; 라는 질문을 던져보았다. 아래 화면에서 볼 수 있듯, 다국어 및 한국어 최적화에 강점이 있다고 답변하였다. 특히, Solar model은 한국어와 영어에 특화되어 있어서 다른 글로벌 모델보다 한국어 처리 능력이 뛰어나고, 이 때문에 한국어 사용자에게 더 자연스럽고 정확한 응답을 제공할 수 있다는 장점이 있다. 또한, 한국어의 복잡한 문법이나 문화적인 맥랑을 이해하는데에 강점을 보일 수 있다고 설명한다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/4e469b99-6a01-439b-a48e-7e9144625a56/image.jpg" alt=""></p>
<p>이번 실습을 통해 나의 개인적인 견해로는, n8n은 UI는 복잡한 코딩 없이 Node와 Edge만으로 간단한 AI Agent workflow를 만들 수 있는 훌륭한 플랫폼이라고 생각한다. 더불어 Upstage API를 활용해 Upstage 제품들을 사용해볼 수 있는 좋은 기회였다.</p>
<h3 id="reference">Reference</h3>
<p><a href="https://n8n.io/?ps_partner_key=NjVjMGJhNGQ4YTM4&amp;ps_xid=Lvkg9CZwnrhdLX&amp;gsxid=Lvkg9CZwnrhdLX&amp;gspk=NjVjMGJhNGQ4YTM4&amp;gad_source=1&amp;gad_campaignid=22894943965&amp;gbraid=0AAAAA-RhEmz5h5pevM5jahp4Jw1evojt1&amp;gclid=Cj0KCQjwo63HBhCKARIsAHOHV_VZ_gxZehFrRU3w5MeEOwtKZKts3jCogi9pFQXzO_wO0F7eT9fL3_YaAvy_EALw_wcB">n8n -homepage</a>
<a href="https://www.docker.com/">Docker</a>
<a href="https://console.upstage.ai/docs/getting-started">Upstage Console</a>
<a href="https://www.upstage.ai/">Upstage - homepage</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Upstage Console 활용하기]]></title>
            <link>https://velog.io/@seohyun_nam/Upstage-Console-%ED%99%9C%EC%9A%A9%ED%95%98%EA%B8%B0</link>
            <guid>https://velog.io/@seohyun_nam/Upstage-Console-%ED%99%9C%EC%9A%A9%ED%95%98%EA%B8%B0</guid>
            <pubDate>Tue, 30 Sep 2025 01:40:08 GMT</pubDate>
            <description><![CDATA[<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/a772ebb0-b3e0-4a79-9bf1-bb44c05ece7f/image.jpg" alt=""></p>
<p>업스테이지 콘솔에서는 자체 개발한 production model들을 직접 경험할 수 있다. 복잡한 문서작업, Q&amp;A service, 핵심 information extract 등의 작업에 LLM을 활용해보고 싶은 경우 여기서 실험해 볼 수 있다. 왼쪽 상단 메뉴중 &quot;Models&quot;를 클릭하면 아래와 같이 여러 AI model들을 확인해 볼 수 있다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/b9df28dc-e750-486c-887d-ac0587275ff1/image.jpg" alt=""></p>
<p>더불어 &quot;compare&quot; 기능이 있어 모델들을 직접 사용해보고 서로 비교분석이 가능하다. &quot;Playground&quot;에는 모델과 함께 이를 직접 테스트 해볼 수 있게끔 예시 자료들을 제공한다. Document Parse의 경우, Json, HTML 형식 모두 제공한다. 상세 내용을 아래 해당 부분들을 자세히 읽어보면 된다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/596be5e3-3165-4b7c-bedb-e3940120d482/image.jpg" alt=""></p>
<p>나는 이들 중 Information Extract model을 사용해 보았다. 아래 화면은 내가 읽고 있는 논문을 직접 업로드해본 모습이다.
Set schema 하단에 Auto-generate 버튼을 누르게 되면, 내가 업로드한 문서에 대한 내용들을 손쉽게 잘 정리해 준다. 이 중 에서 Type은 String, Integer, Boolean, Number로 구성되어 있다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/47d6950e-4055-4fd1-9b18-6e7948dd9a62/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/b018af12-8697-411d-b9b0-3a081701a78f/image.jpg" alt=""></p>
<p>하단의 &quot;Confirm and extract&quot; 버튼을 누르면 다음과 같은 화면이 출력되는데, 나의 경우 다음과 같이 extraction result가 나왔다.  <img src="https://velog.velcdn.com/images/seohyun_nam/post/67408559-ded1-407d-8af8-6ce31d099ab2/image.jpg" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/28af17b2-217d-4880-b305-acb6c0f82669/image.jpg" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/bdbc0eb1-f22b-420f-855f-7bfc4971737e/image.jpg" alt=""></p>
<p>해당 부분이 어디에서 추출된 내용인지 궁금하다면, 클릭하여 해당 위치를 파악할 수 있다. 추가적으로 Json 형식으로도 데이터를 확인해 볼 수 있기 때문에 내가 어떤 작업을 하느냐에 따라서 취사선택이 가능하다. 추가적으로 이 단계까지 마무리 되었다면, 다시 오른쪽 하단에 &quot;Use API with this schema&quot; 버튼을 통해 Upstage API를 사용할 수 있다. Python외에도, cURL, JavaScript를 활용할 수 있다. <img src="https://velog.velcdn.com/images/seohyun_nam/post/e80be958-f896-4444-8594-8bd975efd562/image.jpg" alt=""></p>
<p>Information extract model 말고도, Document parsing 모델을 사용해 볼 수도 있다. 아래 화면을 보면, Business, General, Government, Foreign languages 들의 보고서들을 Parsing 작업을 토해 HTML, JSON 형식으로 추출 한 것을 확인해 볼 수 있다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/8ce5282e-d40f-4249-9873-6767c2cfef53/image.jpg" alt=""></p>
<p>아래 화면은 Document OCR을 활용해본 예시로, 위와 유사하게 Business, Commerce, Finance, Foreign languages 다양한 도메인 영역에 해당 기술을 적용하여 내가 원하는 형태의 데이터를 추출 가능하다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/f9b1c914-3044-427d-804d-1f33c0410622/image.jpg" alt=""></p>
<p>사용법이 궁금하거나, 이 모델이 어떤 서비스를 제공하는지, 작동원리가 어떻게 되는지, API는 어떻게 사용해야 하는지가 궁금하다면, Upstage console에서는 각 해당 모델마다 Documentation과 API Reference를 제공하므로, 해당문서를 확인하면 상세한 설명을 확인해 볼 수 있다. 하단 Reference에 참고링크를 참조해 두겠다.</p>
<p>Upstage에서 개발한 Document intelligence 기술이 어떤식으로 사회의 다양한 영역에 적용되고 활용될 수 있는지 궁금하다면, 업스테이지 콘솔을 적극적으로 활용해 보길 권한다. </p>
<h3 id="reference">Reference</h3>
<p><a href="https://console.upstage.ai/docs/getting-started">console.upstage.ai</a>
<a href="https://console.upstage.ai/api/document-digitization/document-ocr">Document OCR API Reference</a>
<a href="https://console.upstage.ai/docs/capabilities/digitize/document-ocr">Document OCR Documentation</a>
<a href="https://www.upstage.ai/">Upstage - hompage</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Upstage AI Education]]></title>
            <link>https://velog.io/@seohyun_nam/Upstage-AI-Education</link>
            <guid>https://velog.io/@seohyun_nam/Upstage-AI-Education</guid>
            <pubDate>Sun, 21 Sep 2025 08:37:42 GMT</pubDate>
            <description><![CDATA[<p>오늘은 Upstage AI education의 LMS 강의 후기를 작성하고자 한다. </p>
<p>업스테이지에서 제공하는 다양한 AI 교육 프로그램들은 아래 링크를 통해 접속해서 확인해볼 수 있다. </p>
<p><a href="https://edu.upstage.ai/course/ai-fundamentals">edu.upstage.ai</a></p>
<p>나는 해당 프로그램들을 수강하면서 Upstage의 Document Intelligence 기술과 Solar Pro 2 LLM model에 대해서 공부하였고, Upstage API를 활용한 개인 prototype 프로젝트를 제작하여 제출하였다. 최종적으로는 Upstage AI Ambassador 1기에 선발되었다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/647cbb00-1ba4-43d8-8408-fc45222db7ac/image.jpg" alt=""></p>
<p>홈페이지에 접속하게 되면 아래와 같은 화면을 볼 수 있고, 위에 세부 메뉴 중 &quot;Courses&quot; 들을 통해서 더 많은 프로그램들을 접할 수 있다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/46a8508c-455b-4404-a5bf-b533449088ce/image.jpg" alt=""></p>
<p>아래처럼 내가 등록한 프로그램들이 무엇인지 확인할 수 있고, 진행상황 또한 한눈에 파악할 수 있다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/6f8ee48e-a9b2-4937-a492-f98d8ebf820e/image.jpg" alt=""></p>
<p>나는 해당 강의를 모두 수강완료했기 때문에 전부 체크표시가 되어 있다. 혹시라도 Upstage AI Ambassador2기 모집에 관심이 있는 사람들이라면, 아래에 4. Claim Certification에서 강의에 대한 수료증을 받고 이를 따로 첨부해서 AI Ambassador 모집 프로그램에 제출해야 한다.  </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/05723b95-d78a-4413-90bc-530c4b083e5d/image.jpg" alt=""></p>
<p>오른쪽을 화면은 해당 강의에 대한 상세한 설명이 나와있는 모습이다. text로만 되어있는 글을 읽다보면 집중력이 떨어지거나 조금 이해하기 쉽지 않은 부분들이 존재할 수 있는데, 굉장히 쉬운 예시 그림을 통해서 설명하고 있는 내용을 더욱 쉽게 이해할 수 있는 장점이 있다. 상세 API 발급과정과 절차, 사용법 모두 이 강의에 설명되어 있다. 아래 그림처럼 Upstage Console창에 개인 API key를 발급받을 수 있는데, 이것을 활용해 Upstage의 대표적인 LLM 모델 Solar Pro 2, Solar mini model들을 활용해 볼 수 있다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/35bbb2b3-6ab7-4570-8d50-f30bbb94bed3/image.jpg" alt=""></p>
<p>위에 &quot;Dashboard&quot;를 클릭하면, 아래 그림처럼 Solar API를 활용해 내가 무엇을 하고자 하는지에 따라 example code를 제공하기 때문에 이를 참고하면 보다 더 쉽게 기능을 사용해볼 수 있다. 나는 Upstage의 Information extract API와 Document parsing 기능을 사용해서 Document Q&amp;A keyword 추출 서비스 prototype을 제작하였다. </p>
<blockquote>
<p>chat
chat with Resoning
Document parsing
Document OCR
Universal extraction Prebuilt extraction
Document classification
Structured outputs</p>
</blockquote>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/d43d2ba9-32f9-4534-a84c-72adfb820dcb/image.jpg" alt=""></p>
<p>Document Intelligence 기술과 Solar Pro 2 model 그리고 이들이 금융, 법률, 제조, 헬스케어 등 다양한 도메인과 어떻게 융합되어 활용될 수 있는지, 여러 비즈니스 환경에서는 어떻게 다르게 사용되는지 궁금하고 알고자 하는 사람이라면 Upstage AI education program을 적극적으로 활용해보길 권한다. </p>
<h3 id="reference">Reference</h3>
<p><a href="https://www.upstage.ai/">Upstage.ai</a> - Upstage 공식 homepage
<a href="https://edu.upstage.ai/course/ai-fundamentals">edu.upstage.ai</a> - Upstage AI education homepage
<a href="https://www.credential.net/43b9988c-5746-4fd8-8891-f6248b31c23a#acc.favXOnNh">credential.net</a></p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Transformers ]]></title>
            <link>https://velog.io/@seohyun_nam/Transformers</link>
            <guid>https://velog.io/@seohyun_nam/Transformers</guid>
            <pubDate>Tue, 22 Jul 2025 12:24:31 GMT</pubDate>
            <description><![CDATA[<p>Transformer는 NLP task를 위한 신경망 아키텍처의 구성방식을 완전히 바꾸어 놓았다. 2017년 발표된 획기적인 논문, &quot;attention is all you need&quot;에서 처음 소개되었고, 이후 딥러닝 모델의 표준 아키텍처로 자리잡았다. 이들은 과거의 RNN(순환 신경망)과 그 변형 모델들, GRU(게이트 순환 유닛), LSTM(장단기 기억) 등을 완전히 대체했다. 덕분에 우리는 BERT, GPT, ERNIE 등을 통해 이전보다 훨씬 강력한 성능을 가진 아키텍처들을 사용할 수 있게 되었다. 이들은 더 정확하고 빠르며, 병렬학습 덕분에 학습이 훨씬 용이하고 더 뛰어난 결과물을 만들어낸다. 하지만 한계 또한 존재한다. 바로, 해석 가능성의 저하이다. LSTM 셀은 여전히 텍스트의 순차적인 특성을 모호하게나마 반영했지만, Transformer는 단지 3개의 attention module을 덧입힌 trench coat와 비유 될 수 있다. &quot;attention is all you need&quot;라는 말은 Transformer의 전체 구조를 시각화해보면 그 의미가 명확해 진다. 실제로 신경망 구조라고 할 수 있는 2개의 FFN(Feed-Forward Networks)는 전체 아키텍처에서 극히 일부분만 차지한다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/1b621ff7-6dae-4fd7-81ef-faac5822b5b2/image.jpg" alt=""></p>
<p>현재 Transformer는 OpenAI의 GPT, Meta의 Llama, Google의 Gemini와 같은 텍스트 생성 모델에 활용되고 있으며, 텍스트를 넘어 오디오 생성, 이미지 인식, 단백질 구조 예측, 게임 플레이 등 다양한 분야에서 활용되며 versatility(범용성)을 입증하고 있다. 텍스트 생성형 트랜스포머 모델은 다음 단어 예측(next-word prediction) 원리에 기반한다:</p>
<blockquote>
<p>사용자로부터 입력된 텍스트 프롬프트를 바탕으로, 그 다음에 올 가장 가능성 높은 단어는 무엇인가?</p>
</blockquote>
<p>트랜스포머의 핵심적인 기여는 self-attention mechanism에 있으며, 이를 통해 입력 시퀸스 전체를 동시에 처리하고, 
장거리 의존 관계(long range dependency)를 이전 아키텍처보다 훨씬 효과적으로 포착할 수 있다. GPT-2 모델 계열이 대표적인 텍스트 생성형 트랜스포머라고 할 수 있다. 그 중에서 GPT-2 모델은 1억 2400만개의 파라미터를 가지고 있으며 가장 최신이거나 강력한 모델은 아니지만 현재 최첨단 모델들과 핵심 구조와 원리를 공유하고 있기 때문에 기본적인 개념을 이해하기 위해 좋은 예시라고 볼 수 있다. </p>
<blockquote>
<p>모든 텍스트 생성형 트랜스포머는 3가지 핵심적인 구성요소로 이루어져 있다.</p>
</blockquote>
<h2 id="1-embedding">1. Embedding</h2>
<ul>
<li>텍스트 입력은 단어 or sub word 단위의 작은 token들로 나뉘고, 이 token들은 단어의 의미를 수치적으로 표현한 vector인 embedding으로 변환된다. </li>
</ul>
<h2 id="2-transformer-block">2. Transformer block</h2>
<p> 입력 데이터를 처리하고 변형하는 모델의 핵심 연산 단위이다. 각 트랜스포머 블록은 다음의 두가지 구성요소로 이루어져 있다.</p>
<ul>
<li>Attention mechanism: 트랜스포머 블록의 핵심 구성요소로, 토큰 간 상호작용을 통해 문맥 정보 및 단어 간 관게를 학습</li>
<li>MLP (다층 퍼셉트론, Multilayer Perceptron): 각 토큰을 독립적으로 정제하는 feedforward network이다. 
어텐션이 토큰간 정보 전달을 담당한다면, MLP는 각 토큰의 표현을 정교화하게 된다.</li>
</ul>
<h2 id="3-output-probabilities">3. Output probabilities</h2>
<p>트랜스포머 블록을 통과한 임베딩은 linear + softmax layer를 통해 다음에 올 토큰에 대한 확률분포로 변환되고, 이를 통해 모델은 다음 단어를 예측하게 된다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/2b3c6a77-9f44-4cf1-90ad-026891cd2eb5/image.jpg" alt=""></p>
<h2 id="embedding">Embedding</h2>
<p>예를들어, 트랜스포머 모델에 &quot;Data visualization empowers users to&quot;라는 문장을 입력하면, 이 text는 모델이 이해할 수 있는 형식으로 변환되어야 하고, 바로 이 과정에서 임베딩이 필요하다.</p>
<p>Transformer는 텍스트를 임베딩으로 변환하기 위해 4단계를 거치게된다.</p>
<ol>
<li><p>Tokenization --&gt; 입력 문장을 단어 or subword token으로 분해
입력 텍스트를 더 작고 관리하기 쉬운 단위인 토큰으로 나누는 과정으로, 이 토큰은 단어일 수 있고, subword 일 수 있다. 모델이 학습되기 전, 전체 토큰 사전 (vocabulary)이 정의되고 GPT-2의 경우 50,257개의 고유토큰을 사전에 포함하고 있다.
입력 텍스트를 토큰으로 분할하고, 각 토큰에 고유한 ID를 부여했다면, 이 ID들을 기반으로 vecter representation(embedding)을 얻을 수 있다.</p>
</li>
<li><p>Token embedding 추출 --&gt; 각 토큰을 고차원 수치 벡터로 매핑
GPT-2 (small) 모델에서는 각 토큰을 768차원의 벡터로 표현한다. 여기서 이 차원의 수는 모델의 크기에 따라 달라지는데, 이 임베딩 벡터는 (50.257 x 768) 크기의 행렬에 저장되어 있고, 총 약 3900만개의 파라미터를 포함하고 있다. 이 거대한 임베딩 행렬덕분에 모델은 각 토큰에 semantic meaning을 부여할 수 있게 된다.</p>
</li>
<li><p>positional encoding 추가 --&gt; 순서 정보를 나타내기 위해 각 position에 고유한 encoding 추가
Embedding 층에서는 각 토큰의 의미뿐 아니라 입력 문장에서의 위치 정보도 함께 인코딩하게 된다. 모델마다 위치 인코딩 방식은 다르나, GPT-2는 자체적으로 학습된 위치 인코딩 행렬을 사용하며, 이를 훈련과정에서 직접 통합하여 학습한다.</p>
</li>
<li><p>token embedding + positional encoding --&gt; 최종 embedding vector 생성
마지막으로 토큰 임베딩과 위치 인코딩을 더해 최종 임베딩 표현을 생성하는데, 이 결합된 벡터는 각 토큰의 semantic와 position정보를 동시에 담고 있어 트랜스포머 모델이 문맥을 더욱 잘 이해하고 예측할 수 있게 한다. </p>
</li>
</ol>
<p>이렇게 트랜스포머는 문자열 형태의 텍스트를 수학적으로 연산가능한 벡터형태로 변환하여 본격적인 처리를 시작한다.</p>
<h2 id="transformer-block">Transformer block</h2>
<p>트랜스포머 모델의 핵심은 트랜스포머 블록에 있는데, 이 블록은 다음 두가지 주요 구성요소로 이루어져 있다. Multi head self attention과 MLP (Multi layer perceptron)이다. 대부분의 트랜스포머 기반의 모델은 이 트랜스포머 블록을 여러개 쌓아서 구성한다. 입력 token은 첫번째 block부터 마지막 block까지 순차적으로 처리되며, 각 layer를 거치면서 표현이 점차 정교해지고 의미가 풍부해진다. 이러한 계층적 구조 덕분에 모델은 token의 고차원적 의미와 맥락을 효과적으로 파악할 수 있다. 계속 살펴본 예로 GPT-2 (small) 모델은 총 12개의 트랜스포머 블록으로 구성되어 있다.</p>
<h3 id="1-multi-head-self-attention">1. Multi head self attention</h3>
<p>self attention mechanism은 모델이 입력 문장에서 어떤 단어가 중요한지 스스로 판단하여 집중할 수 있도록 한다. 이를 통해 문장 안에서의 의미적 관계나 문법적 의존성을 잘 포착할 수 있게 된다. 멀티헤드 어텐션은 이 메커니즘을 여러개의 주의 집중 head로 동시해 수행하여 여러시점에서 다양한 의미관계를 동시에 파악가능하고, 각 head가 서로 다른 정보를 포착하여 더 풍부한 표현을 생성할 수 있게 된다. </p>
<ol>
<li>Query, Key, and Value Matrices
<img src="https://velog.velcdn.com/images/seohyun_nam/post/9db816f0-f1c5-4916-a809-e6f22d753f9d/image.jpg" alt=""></li>
</ol>
<p>각 토큰의 임베딩 벡터는 3개의 벡터로 변환된다. Q(Query), K(Key), V(Value) 이들은 학습된 Q, K, V 가중치 행렬과 입력 임베딩을 곱하고 편향을 더해 얻는다.</p>
<p>Web search에 쉽게 비유해보자면, Query는 검색창에 입력하는 검색어 (지금 알고싶은 단어)가 되고, Key는 검색 결과의 제목 (어떤 단어들이 참고가능한지 나타냄)이 되고, Value는 검색결과의 실제 컨텐츠로 (관련있는 페이지에서 보고싶은 정보)가 된다. 모델은 이 Q, K ,V 값을 통해 attention score를 계산하고 예측할때 어떤 token에 &#39;집중&#39;할지를 결정하게 된다.</p>
<h3 id="scaled-dot-product-attention">Scaled Dot-Product Attention</h3>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/07862f6b-3e15-4ee8-92ee-3c3ad530b2bd/image.jpg" alt="">
스케일 조정 내적 어텐션의 계산 방식은 아래와 같다. 퀴리와 모든 key간의 dot product(내적)을 계산하고 그 값을 나누어 스케일링한 뒤, softmax 함수를 적용해 각 값에 대한 가중치를 얻는다. 실제로, 여러개의 쿼리를 한번에 처리하기 위해 쿼리를 행렬 Q, 키를 K, 값을 V로 행렬로 묶어서 처리한다. 이렇게 하면 출력행렬이 위 공식과 같게 된다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/29f2c481-dd00-4126-8625-26cb4c1fe4bb/image.jpg" alt=""></p>
<ol start="2">
<li><p>Multi head splitting
Query, Key, Value 벡터는 각가 여러개의 head로 분할되는데, GPT-2 (small)의 경우 12개로 나뉜다. 각 head는 입력의 다른 부분을 독립적으로 처리하여, 다양한 의미/문법적 관계를 포착한다. 이러한 구조 덕분에 모델은 병렬적으로 다양한 언어적 특성을 학습할 수 있고, 표현력도 더 강력해진다. </p>
</li>
<li><p>Masked self-attention
각 head에서 masked self-attention을 수행하게 되는데, 이 과정은 모델이 미래 토큰을 보지 않고 앞부분 정보만을 참고해 다음 토큰을 예측할 수 있도록 돕는다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/6b2a81bf-ca18-40cb-8c95-f91901e80997/image.jpg" alt=""></p>
</li>
</ol>
<ul>
<li>attention 점수 계산: query와 key의 내적(dot product)를 계산해 각 토큰이 다른 토큰과 얼마나 관련이 있는지 수치화한 정사각 행렬을 만든다.</li>
<li>masking: 이 행렬의 오른쪽 위 삼각형 부분(future token)은 -∞ 로 설정하여 미래 정보 접근을 차단한다.</li>
<li>Softmax: masking된 attention score는 softmax 함수를 통해 확률분포로 변환되며 각 행의 합은 1이 된다.</li>
</ul>
<p>이렇게 계산된 attention 가중치는 각 토큰이 왼쪽에 있는 다른 토큰에 얼마나 집중해야할지를 나타내게 된다.</p>
<ol start="4">
<li>Output &amp; Concatenation
각 헤드에서 나온 attention결과를 value 행렬과 곱해 최종 출력을 계산하는데 앞에서 예를 든, GPT-2의 경우 12개의 헤드를 사용하며, 각 헤드는 다른 의미/구조적 관계를 포착하게 된다. 마지막으로 모든 헤드의 출력을 연결(concatenate)한뒤 linear projection을 적용하여 다음 layer로 전달한다.</li>
</ol>
<h3 id="2-mlp-multi-layer-perceptron">2. MLP: Multi-Layer Perceptron</h3>
<p>multi layer self attention이 입력 토큰들 간의 다양한 관계를 포착한 후, 이 연결된 출력은 MLP층으로 전달되어 모델의 표현 능력(representational capacity)를 강화하게 된다.</p>
<p>MLP block은 두개의 linear transformation과 그 사이에 위치한 GELU 활성화 함수로 구성되는데, 첫번째 선형 변환은 입력의 차원을 768 --&gt; 3072로 (4배 증가)시킨다. 두번째 선형 변형은 차원을 다시 3072 --&gt; 768 (원래 크기로 복원)하여, 다음 층에서도 일관된 차원의 입력을 받을 수 있도록 한다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/0443c7c8-1b9d-44d2-9ff1-478e80f0f514/image.jpg" alt=""></p>
<p>self-attention과는 달리, MLP는 각 토큰을 독립적으로 처리하며, 단순히 토큰 표현을 하나의 벡터 공간에서 다른 벡터공간으로 변환한다. </p>
<h2 id="output-probabilities">Output Probabilities</h2>
<p>입력이 모든 트랜스포머 블록을 거쳐 처리된 후, 최종 출력은 마지막 linear layer를 통해 token 예측을 위한 형태로 변환된다.
이 계층은 최종 표현을 50,257차원의 공간으로 사상하는데, 이 숫자는 GPT-2의 전체 어휘 집합(vocabulary) 크기이며, 각 토큰마다 logit이라는 값이 할당되게 된다. 모든 토큰은 다음 단어가 될 수 있기 때문에, 이 과정은 각 토큰이 다음에 등장할 가능성에 따라 순위를 매길 수 있는 기반을 제공한다. 그 다음 이 logit 값에 softmax함수를 적용하여 총합이 1이되는 확률분포로 변환한다. 이렇게 변환된 확률 분포를 바탕으로, 우리는 각 토큰이 다음에 등장할 확률에 따라 샘플링하여 실제 다음 단어를 생성할 수 있다. 
2024년 존스홉킨스 연구팀이 개발한 &#39;Transformer Explainer&#39;를 활용하면 구조를 굉장히 쉽게 파악할 수 있다. 
<img src="https://velog.velcdn.com/images/seohyun_nam/post/013d07f0-144c-4d5d-bb43-a4ff06e00019/image.jpg" alt="">
<img src="https://velog.velcdn.com/images/seohyun_nam/post/4f251dab-484b-4e93-8225-fcda7562db57/image.jpg" alt=""></p>
<p>모델의 출력 확률 분포로부터 다음 토큰을 sampling 하여 생성하는 것이 마지막 단계이다. 이때, temperature 하이퍼파라미터가 중요한 역할을 한다. 수학적으로는 아주 간단한 연산인데, 모델의 출력 logits 값을 temperature 값으로 나눈 후 softmax를 적용하는 방식이다. </p>
<ul>
<li>temperature = 1: logit을 1로 나누게 되면 softmax 결과에 영향을 주지 않는다</li>
<li>temperature &lt; 1: 값이 작을수록, 확률분포가 날카로워지고 모델은 더 결정론적이되며 예측 가능한 출력을 생성한다.</li>
<li>temperature &gt; 1: 값이 클수록, 확률분포가 평탄해지고 무작위성이 커지며 창의적인 출력이 나타날 수 있다.</li>
</ul>
<p>sampling 기법으로는 top-k와 top-p가 있는데 </p>
<ul>
<li>top-k samlpling은 확률이 가장 높은 상위 k개의 토큰만 후보로 제한하고 그 외는 제거하는 방식이다.
낮은 확률의 토큰 제거로 안정성을 향상할 수 있다.</li>
<li>top-p nucleus sampling은 누적 확률이 p 이상되는 최소 토큰 집합만을 고려하는데, 확률이 너무 낮은 토큰은 제외하면서도 다양성을 유지할 수 있게 된다. </li>
</ul>
<h2 id="adavanced-architectural-features">Adavanced Architectural Features</h2>
<p>Transformer model의 성능을 향상시키는 다양한 고급 구조적 기능들이 있다. 아래 내용들은 모델의 학습과 일반화에는 매우 중요하지만, 아케텍처의 핵심 개념을 이해하는데 필수는 아니다. 대표적인 구성요소로, layer normaliazation, dropout, residual conntections(잔차 연결)이 있다.</p>
<h3 id="1-layer-normalization">1. Layer Normalization</h3>
<p>각 층의 출력값을 평균과 분산기준으로 정규화하여, 값의 sclae 차이를 줄이고 학습이 더 잘 되도록 돕는다. 내부의 공변량 변화 문제(internal covariate shift)를 완화하여, 초기 가중치에 대한 민감도를 줄인다. Transformer block 안에서 두번 적용되는데, self-attention 앞과 MLP layer 앞에서 적용된다. 이를 통해 모델의 학습과정을 안정화하고 수렴 속도를 높일 수 있게 된다.</p>
<h3 id="2-dropout">2. Dropout</h3>
<p>학습 중 일부 뉴련의 출력을 무작위로 0으로 설정해, 특정 뉴런에 대한 의존을 줄이는 방법이다. overfitting을 방지하는 정규화 기법으로, 더 강건하거 일반화된 특성을 학습하도록 돕는다. 하지만 추론 시에는 적용되지 않아, 여러 sub model의 ensemble처럼 동작하여 성능이 향상된다.</p>
<h3 id="3-residual-conntections">3. Residual Conntections</h3>
<p>2015년 ResNet에서 처음 제안된 혁신적인 구조로, 입력을 출력에 직접 더해주는 우회경로를 생성하여 vanishing gradient(기울기 소실 문제)를 완화하게 된다. 더 깊은 네트워크로도 학습이 가능해지고, 이전 층까지 gradient가 원활히 흐른다. 마찬가지로 GPT-2를 포함한 Transformer block에서 2번 적용되는데, self attention 이후, MLP이후가 된다.</p>
<p>이 3가지 구성요소들은 Transformer의 성능 향상에 핵심적이 기초 기술로 작용하고, 특히 학습과정에서 큰 차이를 만들어내게 된다.</p>
<p>마지막으로 첨부하는 이 그림은 트랜스포머 구조의 세부적인 부분까지 한 그림에 모두 담고있어 전체적인 숲과 나무를 동시에 보고 이해하는데 매우 도움이 된다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/651fe381-3aaa-458a-88cb-c3ecd7bcbd9d/image.jpg" alt=""></p>
<h3 id="reference">Reference</h3>
<p><a href="https://poloclub.github.io/transformer-explainer/">Transformer Explainer github.io</a>
Transformer Explainer: Interactive Learning of Text-Generative Models (2024) <a href="https://arxiv.org/abs/2408.04619">https://arxiv.org/abs/2408.04619</a>
<a href="https://cme295.stanford.edu/">https://cme295.stanford.edu/</a> - Stanford online lectures
VIP Cheatsheet: Transformers &amp; Large Language Models - AfshineAmidi, ShervineAmidi (2025)
GENAI starter pack -RESHMAWITHAII (linkedin)
Natural language processing with python cheat Sheet (nltk)
Vaswani et al, (2017) Attention Is All You Need. <a href="http://arxiv.org/abs/1706.03762">http://arxiv.org/abs/1706.03762</a> 
Doshi (2021a) Transformers Explained Visually — Not Just How, but Why They Work So Well. Towards Data Science.
Jay Alammar (2018) The Illustrated Transformer. <a href="https://jalammar.github.io/illustrated-transformer/">https://jalammar.github.io/illustrated-transformer/</a>
<a href="https://superstudy.guide">https://superstudy.guide</a>.
The Transformer Architecture: Institute for Analytical Sociology (IAS) at Linköping University (LiU), Sweden. 2023 Hendrik Erz </p>
]]></description>
        </item>
        <item>
            <title><![CDATA[Context Engineering]]></title>
            <link>https://velog.io/@seohyun_nam/Context-Engineering</link>
            <guid>https://velog.io/@seohyun_nam/Context-Engineering</guid>
            <pubDate>Tue, 22 Jul 2025 06:21:30 GMT</pubDate>
            <description><![CDATA[<h2 id="context-engineering-evolution">Context engineering evolution</h2>
<p>LLM (대규모 언어모델)이 단순한 명령 수행 시스템에서 복잡하고 다면적인 애플리케이션의 핵심 추론 엔진으로 진화함에 다라, 이들과 상호작용하는 방식또한 발전하고 있다.
Prompt engineering이라는 용어는 기본 개념으로 중요하지만 현대 AI system이 요구하는 정보 payload의 설계, 관리, 최적화를 포괄하기에는 부족하다. 그 이유는, 이러한 시스템이 하나의 고정된 문자열 텍스트만을 처리하지 않으며, 동적이고 구조화된, 다면적인 정보흐름을 활용하기 때문이다. 이에 대응하기 위해서 &#39;Context Engineering&#39; 이라는 새로운 개념이 생겨나게 되었다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/ddba646b-f0f1-490a-beb8-c74acabc68c2/image.jpg" alt=""></p>
<h2 id="what-is-context-engineering">What is Context engineering?</h2>
<p>Context Engineering을 공식적으로 정의하기 위해서 먼저 autoregressive LLM의 표준 확률모델을 알 필요가 있다. 파라미터  세타로 정의된 이 모델은 입력 컨텍스트 C가 주어졌을때, 출력 sequence Y를 다음의 조건부 확률을 최대화하도록 생성한다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/4ca46176-4fce-4461-9fa6-468a6cfd270c/image.jpg" alt="">
기존의 프롬프트 엔지니어링 패러다임에서는 컨텍스트 C를 단일하고 정적인 텍스트 문자열로 취급하였다. 즉, C = prompt라는 단일 개체로 보았다. 그러나 이러한 관점이 현대의 complex한 system에서는 더 이상 맞지 않았다. Context engineering은 C를 동적으로 구조화된 정보 component 집합으로 재 개념화 한다. 이러한 component들을 일련의 함수들에 의해 획득, 필터링, 포매팅되며 최종적으로 고수준의 조립함수 A에 의해 조율(orchestration)되게 된다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/72e4ce9a-77c5-42b4-a077-e5f36c156dfa/image.jpg" alt="">
여기서 각 component ci는 임의로 정해지는 것이 아니고 참고한 survey 논문에서 다루는 핵심적인 기술영역들과 직접적으로 연결된다. 예를들어, 시스템 명령어 및 규칙, 외부지식(Rag, knowledge graph), 사용 가능한 외부 도구들의 정의 및 시그니처, 이전 상호작용으로부터 축적된 영속적 정보, 사용자, 세계, 또는 멀티에이전트 시스템의 동적 상태, 사용자의 현재 요청이 있다.</p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/42d8b992-8199-4949-b2e2-fdb205ce9dcc/image.jpg" alt="">
Context engineering은 전통적인 prompt engineering과의 근본적이 차별점을 두고 있다. Context engineering은 정교하고 문맥인식이 가능한 AI system을 설계, 이해, 최적화 하기 위해서 필요한 형식적이고 체계적인 framework를 제공한다. prompt design에서 art --&gt; 정보 물류와 시스템 최적화의 science 로의 관점으로 전환한다고 볼 수 있다.</p>
<h2 id="context-scaling">Context scaling</h2>
<p>컨텍스트 스케일링은 문맥 정보처리의 범위와 정교함을 결정짓는 두가지 근본적인 dimension으로 구성된다. </p>
<h3 id="1-length-scaling">1. Length scaling</h3>
<p>ultra-long sequence 처리를 위한 연산적, 구조겆인 과제이다. 이는 수천~수백만의  token 까지 context window를 확장하면서도 긴 이야기, 문서, 상호작용 전반에 걸쳐 coherent understanding을 유지하는것을 목표로 한다.
이를 위해서는 sophisticated attention mechanisom, 메모리 관리 기술, 구조적인 혁신이 필요하다. 이들은 모델이 광범위한 input sequence에서도 문맥적인 일관성을 유지할 수 있게 한다.</p>
<h3 id="2-multimodal-and-structural-scaling">2. Multimodal and structural scaling</h3>
<p>두번째로는 단순한 text를 넘어서는 context 확장을 의미한다. 이는 다차원적이고 동적인 cross-modal 정보구조를 포함한다. 시간 순서에 따른 관계와 시퀸스의 이해인 시간적 컨텍스트, 위치기반 및 기하학적 관계해석의 공간적 컨텍스트, 여러 개체의 변화 상태를 추적하는 참여자 상태, 목표, 동기, 암묵적 목적을 이해하는 의도기반 컨텍스트, 특정 사회적,문화적 맥락에서의 의미를 해석하는 문화적 컨텍스트가 있다. </p>
<p>현대의 Context engineering은 이 두가지 fundamental dimentions들을 동시에 해결할 수 있어야 한다. 실제 애플리케이션에서는 단지 긴 텍스트 뿐만이 아니라 다음과 같은 다양한 데이터 유형을 동시에 처리해야 하기 때문이다.</p>
<ul>
<li>구조화된 지식 그래프</li>
<li>다중모달 입력 (텍스트, 이미지, 오디오, 비디오)</li>
<li>시간적 시퀸스</li>
<li>인간이 자연스럽게 이해하는 암묵적 문맥 신호 등</li>
</ul>
<p>이라한 다차원적 접근 방식은 단순히 모델 파라미터수를 늘리는 scaling을 넘어 인간 지능이 복잡한 현실세계를 이해하는 방식에 가까운 시스템을 구축하려는 근복적인 방향 전환을 의미하게 된다.</p>
<h2 id="why-context-engineering">Why Context engineering?</h2>
<p>현재 대규모 언어모델(LLMs)은 고도화된 컨텍스트 엔지니어링 접근법이 반드시 필요한 기술적 한계에 직면해 있다. 예를들어, self-attention mechanism은 sequence 길이가 늘어날수록 계산량과 메모리 사용량이 제곱 비율로 증가하기 때문에, 긴 context를 처리하는데에 있어서 심각한 장벽이 되고 있다. 이에 따라 chatbot이나 여러 모델의 실제 응용에 부정적인 영향을 미치고 있다. 특히 상용 서비스에서는 동일한 context를 반복적으로 처리해야하기 때문에 추가 latency와 토큰 기반의 과금 비용이 더해져 이러한 문제를 악화시킨다. 계산 자원 문제이외에도 여러 단점들이 존재하고 있다. 빈번한 hallucination(환각), 입력 문맥에 대한 불성실한 응답, 입력 변화에 대한 민감한 반응, 구문적으로는 맞지만 의미적으로 일관성이 없는 응답이 이 있다. 또한 기존의 prompt engineering은 근사기반(approximation-driven)이거나 주관적인 방식에 의존하고 있어서 모델의 개별적인 행동차이를 충분히 고려하지 못하는 경향이 있다. 하지만, 정확하고 풍부한 문맥이 담긴 프롬프트 작성은 모호성을 줄이고 응답의 일관성을 높이기 때문에 프롬프트 엔지니어링은 여전히 중요하다. </p>
<p>고급 context engineering 기법들 (e.g, In-Context Learning, Chain-of-Thought, Tree-of-Thought, Planning)은 정교한 언어 이해 및 생성 능력의 기반이 되며 검색 및 생성 최적화를 통해 강력한 문맥인식 AI응용을 가능하게 한다. 향후 logit Contrast를 활용한 chain-of-thought 보강, 다양한 문맥 유형의 효과적 활용, 특히 코드 인텔리전스 분야에서의 문법, 의미, 실행 흐름, 문서화를 통합, 고도화된 필터링 및 선택 메커니즘을 통해 Transformer 구조의 스케일링 한계 극복 등 성능의 품질을 유지하면서도 확장 가능한 LLM 시스템 개발의 핵심 경로가 된다. </p>
<h2 id="foundational-components">Foundational Components</h2>
<p>Context Engineering은 대규모 언어 모델에서 정보관리를 위한 핵심적 과제를 해결하기 위해 설계된 세가지 기본 구성 요소를 기반으로 구축된다.</p>
<ol>
<li>Context Retrieval and Generation (문맥 검색 및 생성)
프롬프트 설계, 외부지식 검색, 동적 문맥 조립 등을 통해 적절한 문맥 정보를 수집</li>
<li>Context Processing (문맥 처리)
획득된 정보를 최적화하고, 긴 시퀸스를 처리하며, 구조화된 데이터를 통합</li>
<li>Context Management (문맥 관리)
메모리 계층 설계, 압축 기술 개발등을 통해 문맥 정보의 효율적인 조직과 활용을 담당</li>
</ol>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/53f49e43-befc-43d8-ad26-656ef915e153/image.jpg" alt=""></p>
<p>아래는 Artificial Analysis에서 발표한 공식 자료이다. 빅테크 기업들의 LLM을 비교분석하였다. <img src="https://velog.velcdn.com/images/seohyun_nam/post/becb282b-1b36-4e56-b601-26a2d5613de0/image.jpg" alt=""></p>
<p>2025년 보고서에 의하면, 대부분의 AI 모델들의 경우, 현재 미국과 중국이 압도적인 점유율을 차지하고 있는것을 볼 수 있다. 
미국은 추론 기반의 모델에서 선두자리를 지키고 있다. Aritificial Analysis의 intelligence index 기준, 상위 4개의 모델은 모두 미국연구소의 추론 모델이다. 중국의 경우, 비 추론 모델 부문에서 1위를 하였는데, DeepSeek V3 0325가 현재 non-reasoning 부문에서 최고 성능의 모델로 미국 및 타국 모델들을 앞서고 있다. 하지만 그 외 국가들에서는 점진적인 발전이 이루어지고 있지만, 아직 최첨단의 frontier 지능 모델 경쟁에서는 주요한 위치를 차지하지 못하고 있다.
<img src="https://velog.velcdn.com/images/seohyun_nam/post/795fb132-ce9e-4751-ab6d-15fca47f5ec9/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/c7456ca2-8255-46e9-afb4-2fef3683ed7c/image.jpg" alt=""></p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/1f76b235-3c1e-4aaf-a577-bde414b56f02/image.jpg" alt=""></p>
<p>현재는 위그림처럼, 사용자의 프롬프트를 해석하고, 사용 가능한 도구들과 상호작용하여 주어진 작업을 수행하는 LLM 기반의 agent system으로 변화하였다. </p>
<p><img src="https://velog.velcdn.com/images/seohyun_nam/post/79f1497b-6998-4497-944b-97b786ebbb21/image.jpg" alt=""></p>
<p>Open AI는 여전히 선두를 지키고 있고, o3와 o4-mini-high 모델은 최첨단 지능 모델로 평가되고 있다. 구글의 Gemini 2.5 pro도 매우 근접한 수준이다. 높은 intelligence index를 기록한 모델은 공통적으로 thinking을 거쳐 답변하는 추론 기반의 모델이기 때문에 &#39;추론 능력&#39;이 핵심적인 경쟁력이라고 볼 수 있다. 2025년 초 기준 미국의 주요 5대 연구소 (Open AI, Google, Anthropic, sAI, Meta)에 대해 NVIDIA, DeepSeek, Alibaba, Mistral, Amazon도 frontier 모델 대열에 합류하였다. 여기서 핵심 경쟁력이라고 볼수 있는 Reasoning에 대해 부연설명을하기 위해 아래의 그림을 첨부하겠다. <img src="https://velog.velcdn.com/images/seohyun_nam/post/574e481f-0a1f-42f4-b636-fead66f1a0dd/image.jpg" alt=""></p>
<p>해당그림에서는 뚜렷하게 두 그룹으로 Reasoning model vs non-reasoning model로 나뉘게 된다. Reasoning model은 평균적으로 Non-reasoning model보다 최대 10배 더 많은 토큰을 사용하여 intelligence index를 수행하기 때문에 모델간의 성능 비교분석에서 &#39;token efficeincy&#39;도 매우 중요한 기준이 될 수 있음을 보여준다.</p>
<p>단순히 토큰 단가만으로는 reasoning 모델의 실제 비용을 제대로 파악할 수 없다. 이제는 총 토큰 사용량과 조합하여 총 추론비용을 계산해야 합리적인 의사결정이 가능할 수 있다. <img src="https://velog.velcdn.com/images/seohyun_nam/post/104b7af4-4afe-438f-979b-c73aaad90490/image.jpg" alt=""></p>
<p>AI 모델의 성능은 하드웨어에도 크게 좌우된다. 여전히 NVIDIA가 독보적인 점유율을 자랑하고 있다. </p>
<h3 id="reference">Reference</h3>
<p><a href="https://arxiv.org/abs/2507.13334">A Survey of context Engineering for Large Language Models</a>
<a href="https://artificialanalysis.ai/">Artificial Analysis AI Adoption Survey Report H1 2025</a>
Artificial-Analysis-State-of-AI-Q1-2025-Highlights-Report
<a href="https://github.blog/ai-and-ml/llms/the-architecture-of-todays-llm-applications/">The architecture of today&#39;s LLM applications</a></p>
]]></description>
        </item>
    </channel>
</rss>