Post

STAR-MOOC - DNA 기반의 X+AI 실증 강의 요약 (5주차)

창의자율프로젝트 STAR-MOOC 5주차 내용 정리

STAR-MOOC - DNA 기반의 X+AI 실증 강의 요약 (5주차)

 이 포스팅은 26년 1학기 광주과학기술원(GIST) AI대학원에서 수강한 창의자율 프로젝트 과목에 대한 정리글입니다.


📝 강의 요약 노트: 5-1. 네트워킹의 미래 (초연결과 SDN)

1. 강의 주제 및 핵심 키워드

  • 주제: 미래 인터넷의 방향성과 소프트웨어 정의 네트워킹(SDN)의 진화
  • 핵심 키워드: 초연결(Hyper-Connected), 소프트웨어 정의 네트워킹(SDN), 오픈플로우(OpenFlow), 오버레이 네트워크(Overlay Network), 터널링(Tunneling)

2. 주요 내용 요약

  • 기존 인터넷의 한계: 1969년 ARPANET에서 시작된 인터넷은 규모가 커짐에 따라 구조적 복잡성과 보안 문제가 증가하여 새로운 아키텍처(Future Internet)의 필요성이 대두됨.
  • 미래 인터넷을 위한 다양한 시도: 사용자의 이동성을 고려한 IP 체계 개편(IPv6), 신뢰성 기반의 연결(XIA 프로젝트), 위치(IP)가 아닌 콘텐츠의 이름 자체를 찾아가는 통신 방식(NDN) 등이 연구됨.
  • SDN의 등장과 네트워크의 유연화: 정해진 차선만 달려야 했던 과거의 통신망과 달리, 소프트웨어를 통해 트래픽 흐름(Flow)과 차선을 유연하게 변경할 수 있는 패러다임이 안착함.
  • 중앙 집중형 제어 구조: 개별 라우터가 길을 찾던 방식에서 벗어나, 상위의 ‘컨트롤러(Controller)’가 전체 네트워크를 조망하며 스위치들에게 실시간으로 최적의 경로를 지시함.
  • 네트워크 인프라의 전 지구적 통합: SDN 개념은 단순 접속망(Access)을 넘어 광대역망(WAN)과 클라우드 데이터 센터 전체를 아우르는 소프트웨어 정의 인프라(SDI)로 확장되어 구글, AWS 등 글로벌 스케일로 적용되고 있음.
  • 터널링과 라벨링을 통한 진화: 기존 물리적 인프라의 한계를 극복하기 위해 데이터 패킷을 새로운 봉투로 감싸서(캡슐화) 별도의 가상 경로를 만드는 터널링 기술이 발전함.

3. 핵심 개념 및 용어 정리

  • SDN (Software-Defined Networking): 네트워크 장비에서 데이터를 전송하는 기능(Data Plane)과 경로를 제어하는 기능(Control Plane)을 분리하여, 소프트웨어 컨트롤러를 통해 네트워크를 중앙에서 관리하고 프로그래밍하는 기술.
  • OpenFlow (오픈플로우): SDN 구조에서 컨트롤러와 네트워크 스위치 장비 간에 통신하기 위해 사용되는 대표적인 표준 프로토콜.
  • P4 언어: 데이터 평면(Data Plane)이 패킷을 어떻게 처리할지 개발자가 직접 정의하고 프로그래밍할 수 있게 해주는 네트워크 전용 프로그래밍 언어.
  • NDN (Named Data Networking): 목적지의 IP 주소를 묻는 대신, 원하는 ‘데이터(콘텐츠)의 이름’을 네트워크에 요청하여 데이터를 가져오는 차세대 인터넷 아키텍처.
  • VXLAN (Virtual eXtensible LAN): 기존 VLAN의 식별 한계(최대 약 4,000개)를 극복하기 위해, 라벨링과 터널링을 이용해 수십만 대의 기기가 있는 대규모 데이터 센터 내부를 논리적으로 분할하고 연결하는 가상화 기술.

4. 한 줄 결론

  • 미래의 네트워크는 고정된 물리적 인프라의 한계를 벗어나, 소프트웨어 중심(SDN/SDI)의 중앙 제어와 오버레이 기술을 통해 전 지구적 규모의 초연결성과 유연성을 확보하는 방향으로 진화하고 있음.

📝 강의 요약 노트: 5-2. 소프트웨어 정의 인프라(SDI)와 초연결 네트워킹

1. 강의 주제 및 핵심 키워드

  • 주제: 소프트웨어 정의 인프라(SDI)의 확장과 차세대 초연결 네트워크 아키텍처
  • 핵심 키워드: SDI, 네트워크 슬라이싱(Network Slicing), 엣지 컴퓨팅(Edge Computing), 패브릭(Fabric), 팩트 트리(Fat-Tree), ABCD 프레임워크

2. 주요 내용 요약

  • SDI의 완성 및 보안 통합: SDN과 네트워크 기능 가상화(NFV)가 결합하여 전체 인프라를 통제하는 SDI로 발전함. 여기에 아무도 믿지 않는다는 전제의 ‘제로 트러스트(Zero Trust)’ 보안이 내재화되고, 클라우드 네이티브 환경에 친화적인 융합형(Converged) 인프라가 구축되고 있음.
  • 네트워크 슬라이싱 (5G/6G 및 특화망): 도로의 ‘버스 전용 차선’처럼, 특정 목적을 위한 전용 네트워크 경로를 논리적으로 분리하는 기술임. 5G 단독모드(SA, Standalone) 전환과 함께 본격화되며, O-RAN(개방형 무선 접속망) 기반의 사설망(스마트 팩토리, 조선소 등) 구축에 핵심적으로 사용됨.
  • End-Edge-Core 계층적 분산 구조: 과거의 중앙 집중형 클라우드에서 벗어나 역할을 분담함.
    • Core (중앙 클라우드 데이터센터): 거대한 컴퓨팅 자원을 활용한 무거운 AI 모델 학습(HPC, HPDA)
    • Edge (사용자 접점): 병원, 공장 등에서 발생하는 데이터를 즉각적으로 처리하고 가벼운 AI 추론을 수행하여 빠른 응답성 확보
  • 3D 초연결 메쉬 (3D Hyper-Connected Mesh): 네트워크의 범위가 지표면을 넘어 대기권과 위성까지 포함하는 입체적인 형태로 진화하고 있음. (이러한 막대한 투자가 필요한 기술은 주로 군사적 수요에 의해 선도되고 있음.)
  • 패브릭과 팩트 트리 구조: 여러 거점(허브 도시 등)을 하나처럼 묶어주는 광역망 개념이자, 동시에 단일 데이터 센터 내부에서 수십만 대의 AI 기기들을 병목 없이 연결하는 촘촘한 스위치 연결망(Interconnect)을 ‘패브릭(Fabric)’이라고 부름. 이를 구현하기 위해 3차원적이고 유기적인 ‘팩트 트리(Fat-Tree)’ 형태의 스위치 토폴로지가 도입됨.
  • ABCD 프레임워크: 차세대 IT 서비스의 기반이 되는 네 가지 요소로, AI (인공지능), Blockchain (데이터 신뢰성 검증), Cloud (컴퓨팅 자원), Data (데이터 생성 및 활용)의 유기적인 결합을 의미함.

3. 핵심 개념 및 용어 정리

  • SDI (Software-Defined Infrastructure): 컴퓨팅, 스토리지, 네트워크 등 모든 IT 인프라 자원을 소프트웨어로 가상화하고 중앙에서 제어하는 환경.
  • NFV (Network Functionality Virtualization): 방화벽, 라우터 등의 통신 네트워크 기능을 전용 하드웨어 장비에서 분리하여 가상화된 소프트웨어로 실행하는 기술.
  • 네트워크 슬라이싱 (Slicing): 하나의 물리적 통신망을 여러 개의 논리적 가상 망으로 쪼개어, 각 서비스(예: 초저지연 자율주행, 대용량 영상 스트리밍)에 맞는 맞춤형 통신 품질을 제공하는 기술.
  • Fat-Tree (팩트 트리): 데이터 센터 내에서 코어 스위치로 갈수록 대역폭(차선)을 넓혀주어 수많은 서버 간의 통신 병목 현상을 막아주는 나무 형태의 3차원 네트워크 구조.

4. 한 줄 결론

  • 현대의 네트워킹은 단순 데이터 전송을 넘어, 엣지와 클라우드를 잇는 입체적 패브릭 구조 속에서 슬라이싱과 SDI를 통해 AI와 다양한 데이터 서비스를 유연하고 안전하게 뒷받침하는 거대한 유기체로 진화하고 있음.

📝 강의 요약 노트: 5-3. 디지털 SOC와 초연결 네트워킹의 완성

1. 강의 주제 및 핵심 키워드

  • 주제: 디지털 SOC로서의 공유 인프라와 초거대 AI 시대를 뒷받침하는 데이터/서비스 네트워킹 기술
  • 핵심 키워드: 디지털 SOC(Digital SOC), DevSecOps, X+AI, HPC-AI 융합, NVLink(GB200 NVL72), 제로 카피(Zero-Copy / RDMA), 마이크로서비스 아키텍처(MSA), 서비스 체이닝(SFC)

2. 주요 내용 요약

  • 디지털 SOC와 공통 플랫폼: 클라우드와 네트워크 인프라는 철도망(KTX/SRT)처럼 모두가 규칙을 공유하고 함께 사용하는 공공재(SOC) 성격을 띰. 이를 위해 ‘인프라 - 플랫폼 - 서비스’의 역삼각형 구조를 가지며, 쿠버네티스 등 클라우드 네이티브 기반의 공통 플랫폼이 필수적임.
  • 자동화와 DevSecOps: 다수가 공유하는 인프라의 마모와 보안 위협을 방지하기 위해, 개발(Dev), 운영(Ops), 보안(Sec)이 결합된 자동화된 파이프라인(DevSecOps)이 뒷받침되어야 함.
  • HPC-AI 융합과 초밀도 GPU 클러스터: 고성능 컴퓨팅(HPC)과 AI 연산이 GPU 중심으로 통합되고 있음. 수십 개의 GPU를 초고속 통신망(NVLink)으로 묶어 하나의 거대한 칩처럼 사용하는 GB200 NVL72와 같은 시스템이 등장하며, 랙당 전력 소모(5kW → 120kW 이상)와 네트워크 복잡도(랙당 5,000가닥 이상의 통신선)가 폭발적으로 증가함. (마치 아파트가 초고층화되는 것과 같은 원리)
  • 데이터 운송의 혁신 (Zero-Copy): 대용량 데이터를 처리할 때, 창고(메모리)에서 꺼내 중간에 재포장(Copy)하는 과정 없이 상대방의 메모리 공간으로 직접 꽂아 넣는 기법(Zero-Copy, RDMA)을 통해 전송 지연과 병목 현상을 획기적으로 해결함.
  • 서비스 체이닝 (Service Function Chaining)과 MSA: 컨테이너화된 작은 기능(마이크로서비스)들을 유연하게 조합하여 최종 서비스를 완성하는 과정(Service Composition) 역시 네트워킹을 통해 도어(네트워크 대역폭) 크기와 기능에 맞춰 동적으로 배치되고 연결됨.

3. 핵심 개념 및 용어 정리

  • Digital SOC (디지털 사회간접자본): 도로나 철도처럼 다양한 융합형 AI 서비스(X+AI)가 효율적으로 작동할 수 있도록 기반을 제공하는 공유형 IT 인프라 환경.
  • NVLink & GB200 NVL72: 엔비디아(NVIDIA)가 개발한 초고속 GPU 간 연결 통신 기술. 여러 개의 GPU가 마치 하나의 메모리를 공유하는 것처럼 작동하게 하여, 초거대 AI 모델의 병렬 연산을 가능하게 하는 핵심 네트워크망.
  • RDMA (Remote Direct Memory Access) / Zero-Copy: 네트워크 통신 시 CPU를 거치지 않고 네트워크 카드(NIC)가 상대방 컴퓨터의 메모리에 직접 접근해 데이터를 읽고 쓰는 기술. 중간 복사 과정이 생략되어 처리 속도가 매우 빠름.
  • SFC (Service Function Chaining): 다양한 네트워크 기능이나 마이크로서비스 애플리케이션들을 사용자의 요구와 트래픽 흐름에 따라 논리적인 ‘체인(사슬)’처럼 엮어 순차적으로 처리하게 만드는 네트워크 기술.

4. 한 줄 결론

  • 현대의 초연결 네트워킹은 단순한 데이터 전달망을 넘어, RDMA와 초고속 GPU 스위칭을 통해 거대한 클라우드 자원을 하나의 컴퓨터처럼 움직이게 하고(HPC-AI), 수많은 마이크로서비스를 민첩하게 엮어내는 초거대 AI 서비스의 핵심 신경망임.

This post is licensed under CC BY 4.0 by the author.