[테크 인사이드] SSD 100% 활용위한 최적의 AFA (올 플래시 어레이) 도입 방안은
디지털데일리발행일 2015-08-13 09:50:07
가
가
박준영
AFA(All Flash Array, 올 플래시 어레이)는 강력한 성능을 앞세워 지난해부터 스토리지 업계를 넘어 엔터프라이즈 컴퓨팅 업계의 최대 화두로 떠올랐다.
하지만 모든 AFA 제품이 ‘만병통치약’일 수는 없다. AFA에는 솔리드스테이트드라이브(SSD)가 장착되는데, AFA에서 SSD를 잘 활용하려면 기존 하드디스크드라이브(HDD와 다른 어떤 장단점을 갖고 있는지, HDD 기반 스토리지와 비교해 어떤 아키텍처와 운영체제(OS)가 필요한지 확인할 필요가 있다.
올 플래시 어레이는 SSD에 최적화된 새로운 기술이 필요
기존 HDD 스토리지는 HDD 자체의 성능제약으로 스토리지 성능 향상에 한계가 있었다. 스토리지 컨트롤러의 중앙처리장치(CPU) 성능과 메모리 집적도는 지난 20년 동안 4000배 향상된 것에 비해 HDD의 성능은 3배 밖에 증가하지 않았다.
이 차이를 보완하기 위해 랜덤 I/O를 순차 I/O로 변경하고 자주 사용되는 데이터를 메모리에서 캐싱하는 등 HDD를 위해 고안된 다양한 기술과 알고리즘으로 HDD 스토리지를 새롭게 설계해왔다.
근본적인 HDD의 성능 한계를 해결할 수 없어 플래시 기술을 스토리지에 도입한 AFA가 등장했다. SSD는 HDD와 전혀 다른 저장매체 특성을 갖고 있다. 만약 SSD를 탑재한 AFA에 HDD 기반 기술을 그대로 적용하면 어떻게 될까? SSD는 랜덤과 순차 I/O 구분 없이 HDD보다 100배 이상의 성능을 제공할 수 있다. 이 때 SSD로 교체하면 디스크 성능은 향상되나 반대로 스토리지 컨트롤러에서 성능 병목현상이 발생할 수 있다.
기존 미드레인지 HDD 스토리지 아키텍처는 2개의 컨트롤러로 구성되어 있고 대부분의 AFA는 이 컨트롤러에 SSD를 탑재하는 것으로 설계되어 있다. 2개의 컨트롤러로 설계된 AFA에 SSD를 일정수량 이상 탑재하면 낮은 성능의 시리얼ATA HDD를 장착하는 것과 동일하다.
더욱이 기존 HDD 스토리지에서 사용하지 않았던 중복제거와 압축 기능까지 컨트롤러에서 제공하기 때문에 성능 병목현상은 더욱 심해진다. 따라서 SSD를 증설하거나 용량이 많아질수록 이를 처리하기 위한 컨트롤러의 부담은 더욱 커지고 성능은 크게 하락할 수밖에 없다. SSD의고성능을 충분히 뒷받침할 수 있는 새로운 AFA 전용 하드웨어 아키텍처가 필요한 것이다.
SSD 성능을 저하시키는 가비지콜렉션(Garbage Collection) 방지기술
SSD가 언제나 일관된 고성능을 보장하지는 않는다. SSD는 읽기/쓰기 성능은 좋으나 삭제 성능은 낮은 편이다. SSD는 HDD와는 달리 사용하지 않는 불필요한 과거 데이터를 삭제하는 가비지콜렉션(Garbage Collection) 작업을 주기적으로 수행해야 하는데, SSD의 삭제 성능이 좋지 않기 때문에 이 작업을 수행할 때마다 AFA 성능은 크게 하락한다. 따라서 기존 HDD 스토리지 운영체계를 그대로 AFA에 적용할 경우에는 가비지콜렉션으로 인한 주기적인 성능 하락을 방지할 수 없게 된다.
더욱이 대부분의 AFA는 HDD 성능 향상을 위해 연속된 공간에 쓰기 작업을 수행하는 로그 스트럭처링(Log Structuring) 기술을 그대로 사용한다. AFA를 운영하면 할수록 SSD의 연속된 여유 공간은 점차 줄어들 수밖에 없고, 연속된 여유 공간을 확보하기 위해 가비지콜렉션 작업을 계속 수행하게 되어 AFA 성능은 계속 하락한다. 따라서 SSD에 최적화된 새로운 쓰기 기술과 OS를 적용해 가비지콜렉션을 방지해야 SSD의 일관된 고성능을 보장할 수 있다.
AFA에 사용되는 SSD 종류와 내구성에 대한 확인
HDD와 달리 SSD는 쓰기횟수에 제한이 있어 안정성을 높이는 기술이필요하다. 지금까지 모든스토리지는 RAID라는 기술을 사용했다. RAID는 여러 개의 HDD를 모아 중복된 쓰기 작업을 수행해서 데이터를 보호하는 기술이다. 사실 RAID는 SSD를 위한 기술이 아니다. 쓰기횟수가 많아지기 때문에 SSD 내구성을 하락시키지만, 대부분의 AFA는 HDD 스토리지를 위해 고안된 RAID 기술을 그대로 사용해 안정성에 큰 위협이 된다.
또한 SSD는 쓰기 내구성에 따라 eMLC(Enterprise MLC)와 cMLC(Consumer MLC)로 구분된다. eMLC는 cMLC보다 약 8배 높은 쓰기 내구성을 가지고 있기에 AFA의 SSD 종류와 쓰기 내구성, 쓰기 횟수를 최소화하기 위한 새로운 SSD전용 기술이 적용되었는지 검토해야 한다.
성능 저하 없는 데이터 절감 기술
AFA에서는 중복제거와 압축을 통해 AFA에 저장되는 데이터 용량을 크게 절감시킬 수 있다. 데이터 복제본 역시 중복제거 및 압축이 가능해 복제본을 위한 추가 저장 용량이 필요 없을 뿐 아니라, 개발/테스트/분석 등을 위한 복제본을 원하는 만큼 생성해 활용할 수 있다.
저장되는 용량이 줄어들기 때문에 상면 절감을 통한 추가적인 비용 절감 효과도 제공한다. 여러 대의 기존 HDD 스토리지들을 단일 랙(Rack)의 AFA로 통합해 구축할 수 있어 상면 비용 절감과 관리 인력과 시간 역시 줄일 수 있다.
하지만 중복제거/압축 작업으로 인해 AFA의 성능 저하가 발생하면 안 된다. 중복제거/압축 방식은 크게 실시간 자동으로 진행하는 인라인(Inline)과 데이터를 1차로 저장한 후 작업하는 포스트(Post) 처리로 나뉜다. 대부분의 AFA는 한꺼번에 데이터를 모아 주기적으로 수행하는 포스트 방식으로 처리하기 때문에 주기적으로 성능이 하락된다.
또한 컨트롤러와 SSD 간의 호스트 I/O 뿐만 아니라 추가적인 중복제거와 압축 I/O가 발생해 전체 AFA 성능이 저하될 뿐 아니라 포스트 처리를 위한 추가적인 쓰기로 SSD의 내구성이 하락된다.
포스트 중복제거/압축 방식은 AFA의 일관된 성능과 안정성을 보장할 수 없으므로, 어떤 방식으로 데이터 절감 기술이 적용되는지, 그로 인해 성능 저하나 SSD 내구성 하락을 유발하지 않는지 검토해야 한다.