공부정리
SQL vs NoSQL (MySQL vs MongoDB)
에드박
2020. 12. 13. 02:09
SQL (Structured Query Language) - RDB(Relational Database)
- 구조화된 쿼리 언어라는 뜻으로 특정 유형의 데이터베이스와 상호작용하는데 사용하는 쿼리언어
- SQL을 사용하면 관계형 데이터베이스 관리 시스템에서 저장, 수정, 삭제 및 검색이 가능합니다.
이 글에서 SQL은 관계형 데이터베이스를 의미합니다.
SQL의 주요 특징
- 데이터는 엄격한 데이터 스키마를 따라 데이터베이스 테이블에 저장됨.
- 데이터는 관계를 통해서 연결된 여러개의 테이블에 분산됨.
1. 엄격한 스키마
- 데이터는 테이블(table)에 레코드(record)로 저장되며 각 테이블에는 명확하게 정의된 구조가 있습니다.
- 관계형 데이터베이스에는 스키마를 준수하지 않는 레코드를 추가할 수 없습니다.
- 더 많은 필드의 레코드 또는 적은 필드의 레코드는 추가할 수 없다는 의미입니다.
구조란? 어떤 데이터가 테이블에 들어가고 어떤 데이터가 그렇지 않을 지를 정의하는 필드 집합을 의미합니다.
필드(field) = 컬럼(column)
레코드(record) = 행(row)
2. 관계
- 데이터들을 여러개의 테이블에 나누어서 데이터들의 중복을 피할 수 있음
- 하나의 테이블에서 중복없이 하나의 데이터만을 관리하기 때문에 다른 테이블에서 부정확한 데이터를 다룰 위험이 없습니다.
만약 사용자가 구매한 상품들을 나타내기 위해서는 User(사용자), Product(상품), Orders(주문한 상품) 여러 테이블을 만들어야 하지만 각각의 테이블은 다른 테이블에 저장되어있지 않은 데이터를 가지고 있습니다.
NoSQL (비관계형 데이터베이스)
- SQL과는 반대되는 접근 방식때문에 NoSQL 이라는 이름이 지어짐
- 스키마 없음 (Schema-less)
- 관계 없음
문서(Document)는 관계형 데이터베이스(RDB)의 레코드(Record) 와 유사한 개념입니다.
컬렉션(Collection)은 관계형 데이터베이스(RDB)의 테이블(table) 과 유사한 개념입니다.
SQL | NoSQL |
레코드(record) | 문서(document) |
테이블(table) | 컬렉션(collection) |
NoSQL 과 SQL의 핵심적인 차이
SQL
- 정해진 스키마에 따르지 않으면 데이터를 추가할 수 없습니다.
NoSQL
- 다른 구조의 데이터를 같은 컬렉션에 추가할 수 있습니다. 즉, 스키마에 대해 신경쓸 필요가 없습니다.
- 문서(document)는 JSON 데이터와 조금 비슷한 형태를 가지고 있습니다.
- 일반적으로 관련된 데이터는 동일한 컬렉션에 넣습니다. (RDB 처럼 여러 테이블에 나눠 담지않습니다.)
- 여러 테이블/콜렉션에 join할 필요없이 이미 필요한 모든것을 갖춘 문서(document)를 작성하게됩니다.
- 실제로 NoSQL에는 join이라는 개념이 없습니다.
NoSQL에서 만약 조인을 하고싶다면 직접 해당 외래키를 검색하여 사용할 수 있겠지만 일반적인 방법은 아닙니다.
NoSQL은 join대신 데이터를 복제해서 각 컬렉션 일부분에 속하는 데이터를 정확하게 산출하도록 합니다.
이 방식의 주의할 점
- 데이터가 중복되기 때문에 불안정한 측면이 있음
- 실수로 컬렉션 B에서는 수정하지 않았는데 컬렉션 A에서만 데이터를 업데이트 할 수 있음 (데이터 불일치 발생)
- 단점은 특정 데이터를 같이 사용하는 모든 컬렉션에서 똑같은 데이터 업데이트를 수행해야한다는 것
- 이런 방식의 큰 장점은 (복잡하고 어떤 순간에는 느린) Join을 사용할 필요가 없다는 것
- 필요한 데이터가 이미 하나의 컬렉션에 저장 되어있기 때문
- 자주 변경되지 않는 데이터일 때 더 큰 장점
수직적(Vertical) & 수평적(Horizontal) 확장(Scaling)
두 종류의 데이터베이스를 비교할 때 살펴 봐야할 중요한 개념은 "확장" 입니다.
데이터베이스를 확장하는 방법? (데이터베이스 서버의 확장성)
- 확장은 수직적(Vertical)확장과 수평적(Horizontal)확장이 있습니다.
- 수직적 확장 : 데이터베이스 서버의 성능을 향상시키는 것 (CPU 업그레이드 같은)
- 수평적 확장 : 더 많은 서버 추가, 데이터베이스가 전체적으로 분산됨을 의미. 하나의 데이터베이스에서 작동하지만 여러 호스트에서 작동함
SQL의 확장
- 데이터가 저장되는 방식 때문에 SQL 데이터베이스는 일반적으로 수직적 확장만은 지원
- '샤딩'이라는 개념이 있지만 특정 제한이 있으며 구현하기가 대체로 어렵습니다.
샤딩이란?
같은 테이블 스키마를 가진 데이터를 다수의 데이터베이스에 데이터를 분산하여 저장하는 방법을 의미합니다.
샤딩을 사용하면 프로그래밍, 운영적인 복잡도는 더 높아지는 단점이 있습니다.
따라서, 가능하면 샤딩을 피하거나 지연시킬 수 있는 방법을 찾아야합니다.
NoSQL의 확장
- 수직적 확장, 수평적 확장 둘다 가능합니다.
- SQL과 달리 NoSQL은 수평적 확장이 기본적으로 지원되므로 여러 서버에서 데이터베이스를 쉽게 분리할 수 있습니다.
어떤 데이터베이스를 선택할 것인가?
- 확실한 정답은 없습니다.
- SQL, NoSQL 모두 훌륭한 솔루션
- 두가지 중 하나를 선택하는 문제에서는 어떤 데이터를 다루는지, 어떤 애플리케이션에서 사용되는지를 고려해야 합니다.
SQL의 장점
- 명확하게 정의된 스키마
- 데이터의 무결성 보장
- 관계는 각 데이터를 중복없이 한번만 저장함
- SQL은 중복된 데이터가 없기 때문에 수정을 해야하는 경우 한번만 수행하면 됩니다.
NoSQL의 장점
- 스키마가 없기 때문에 SQL보다 더 유연함, 언제든지 저장된 데이터를 조정하고 새로운 "필드"를 추가할 수 있음
- 데이터는 애플리케이션이 원하는 형식으로 저장됨. 이렇게 하면 데이터를 읽어오는 속도가 더 빠름
- 수직 및 수평 확장이 가능하므로 데이터베이스가 애플리케이션에서 발생시키는 모든 읽기 / 쓰기 요청을 처리할 수 있습니다.
SQL의 단점
- 상대적으로 덜 유연함. 데이터베이스 스키마는 사전에 계획하고 알고 사용해야 합니다.
- 스키마는 나중에 수정하기가 힘들거나 불가능할 수 있습니다.
- 관계를 맺고 있기 때문에, Join문이 많은 매우 복잡한 쿼리가 만들어 질 수 있습니다.
NoSQL의 단점
- 유연성 때문에, 데이터 구조 결정을 못하고 미루게 될 수 있습니다.
- 데이터 중복은 여러 컬렉션과 문서가 여러개의 레코드가 변경된 경우 업데이트 해야합니다.
- 데이터가 여러 컬렉션에 중복되어 있기 때문에, 수정(update)를 해야하는 경우 모든 컬렉션에서 수행해야 합니다
SQL을 사용하면 좋은 경우
- 관계를 맺고있는 데이터가 자주 수정(변경)되는 애플리케이션일 경우
- 변경될 여지가 없고, 명확한 스키마가 사용자와 데이터에게 중요한 경우
NoSQL을 사용하면 좋은 경우
- 정확한 데이터 구조를 할 수 없거나 변경/확장 될 수 있는 경우
- 읽기(read)처리를 자주하지만, 데이터를 자주 변경(update)하지 않는 경우 (즉, 한번의 변경으로 여러 문서를 변경할 일이 없는 경우)
- 데이터베이스를 수평으로 확장해야 하는 경우 (막대한 양의 데이터를 다뤄야 하는 경우)
정리
분명한 것은 데이터베이스는 다른 방식으로 설계할 수 있다는 점입니다. NoSQL 데이터베이스를 사용하더라도 언급한 단점을 완화할 수 있습니다(예를들어 중복된 데이터를 줄이는 법). SQL 데이터베이스도 요구사항을 만족시키고 복잡한 Join문을 만들지 않도록 설계할 수 있습니다.
부록. MySQL(RDB) vs MongoDB(NoSQL)
MySQL
- 관계형 데이터베이스
- 오픈 소스이며 다중 사용자, 다중 스레드를 지원합니다.
MongoDB
- Document-Oriented(문서 지향적) NoSQL 데이터베이스
- 오픈 소스이며 C++로 작성되었습니다.
MySQL 과 MongoDB 비교
Terms
RDB(MySQL) | MongoDB |
Database | Database |
Table | Collection |
Tuple / Row | Document / BSON document |
Column | Field |
Table Join | Embedded Documents & Linking |
Primary Key | Primary Key(_id) |
Database Server
MySQL | MongoDB |
mysqld | mongod |
Database Client
MySQL | MongoDB |
mysql | mongo |
SQL
MySQL | MongoDB |
Insert | |
insert into users ("name", "city") values("lee", "seoul") | db.users.insert({ name: "lee", city: "seoul" }) |
Select | |
select * from users where name="lee" | db.users.find({ name: "lee" }) |
Update | |
update users set city="busan" where name="lee" | db.users.update({ name: "lee" }, { $set: { city: "busan" }}) |
Delete | |
delete from users where name="lee" | db.users.remove({ name: "lee" }) |
참고