2014년 6월 8일 일요일

DAS, NAS, SAN 그리고 HDFS

DAS(Direct-attached storage)
서버에 직접 연결된 스토리지이며, 일종의 외장형 HDD로 이해하면 된다.

NAS(Network-attached storage)
Network로 접속가능한 독립된 저장장치이다.(운영체제) 일종의 파일서버로 이해하면 된다.
LAN을 지원하며, HDD의 fail over시 복구를 위해 RAID(Redundant Array of Independent Disks)로 구성된다.

SAN(storage area network)
수십에서 수백대의 SAN스토리지를 데이터 서버에 연결해 총괄적으로  관리해주는 네트워크를 의미. DBMS와 같이 안정적이고 빠른 접근이 필요한 데이터를 저장하는데 사용.

SAN과 NAS의 차이점
NAS는 데이터 파일을 작동하는 하나의 저장장치이다. 반면에 SAN은 디스크 블록들 위에서 작동하는 다양한 저장장치의 로컬 네트워크이다.

SAN과 NAS의 구현기술
SAN은 일반적으로 Fibre Channel 통신을 사용한다. NAS는 일반적으로 이더넷과 TCP/IP통신을 사용한다.

SAN과 NAS의 사용모델
집 또는 소규모 비즈니스 운영 네트워크는 NAS 장치에서 그것들의 LAN으로 접속할 수 있다. NAS는 컴퓨터와 다른 TCP/IP 장치들에 비교해서 자체의 IP를 유지한다. S/W 프로그램을 사용함으로써, 네트워크 관리자는 NAS와 모든 다른 접속 장치들 사이에서 자동 또는 수동으로 백업과 파일 카피를 수행할 수 있다. NAS는 기가바이트에서 테라바이트까지 데이터를 저장할 수 있다. 관리자는 추가적인 NAS 장치를 인스톨하여 소토리지 용량을 네트워크에 추가할 수 있다. 그렇지만 각각의 NAS는 독립적으로 작동한다.

엔터프라이즈급 네트워크 관리자는 '테라바이트의 공유된 파일 저장공간 또는 매우 빠른 스피드의 파일 전송 운영체제'를 필요로 할 지 모른다. 다수의 NAS 장치를 하나의 묶음으로 인스톨하는 것은 실용적인 옵션이 아니다. 대신에 관리자는 단일 SAN을 인스톨한다. 그것은 고성능 (필요로하는 용량과 성능을 제공하는)디스크 묶음을 유지할 수 있다. 관리자에게는 SAN의 유지와 환경설정을 할 수 있는 적절한 지식과 훈련이 필요하다.

SAN과 NAS의 융합
TCP/IP 그리고 이더넷과 같은 인터넷 기술들이 세계적으로 널리퍼져있기 때문에, 몇몇 SAN 제공업체는 Fibre Channel을 같은 IP기반의 접근가능한 NAS 사용처로 변환시켜주는 작업을 진행중이다. 역시, 디스크 저장 기술의 빠른 향상으로, 오늘날 NAS장치들은 SAN과 함께 구성되었을 때 가능했던 저장공간과 성능을 제공한다. 이러한 두 산업적인 요소가 NAS와 SAN의 부분적인 융합을 네트워크 저장으로의 접근으로 주도하고 있다.

참조링크 : SAN vs NAS

HDFS(Hadoop Distributed File System)
하둡에서 제공하는 분산 파일시스템을 의미합니다.
HDFS와 기존 대용량 파일 시스템의 가장 큰 차이점은 저사양 서버를 이용해 스토리지를 구성할 수 있다는 점입니다. 기존에는 대용량 파일 시스템 혹은 DB서버를 구성하려면 고성능의 서버를 준비해야하며, 이러한 고성능 서버는 웹서버에 비해 상당히 많은 비용이 발생합니다. HDFS를 이용하면 수십 혹은 수백 대의 웹 서버급 서버를 묶어서 하나의 스토리지처럼 사용할 수 있습니다. 이때 HDFS에 저장되는 데이터는 물리적으로는 분산된 서버의 로컬 디스크에 저장됩니다.

댓글 없음 :

댓글 쓰기