1 minute read

{
    "first_name": "Paul",
    "surname": "Miller",
    "cell": "447557505611",
    "city": "London",
    "location": [45.123, 47.232],
    "profession": ["banking", "finance", "trader"],
    "cars": [
        {
            "model": "Bentley",
            "year": 1973
        },
        {
            "model": "Rolls Royce",
            "year": 1965
        }
    ]
}

이런 식의 데이터가 있다고 생각해 보자.

앞부분의 이름, 전화번호 등등의 값은 one to one 대응이라 어떤 방식을 써도 크게 문제는 되지 않는다. 하지만 직업과 자동차의 경우는? (one to many) 혹은 인스타그램등의 경우 팔로잉과 팔로워의 경우는? (many to many)

또한 많은 사람들의 목록을 위와 같은 형식으로 저장하고 있는데 거기에 아래와 같은 회사 데이터를 모두 넣고 싶다고 해 보자.

{   
    "company" : apple,
    "company_addr" : CA,
}

각각의 인물 데이터에 회사 정보를 일일이 넣을 것인가? 혹은 회사 데이터를 따로 만든 후 회사명을 통해 두가지 데이터를 연결해줄 것인가?

어떤 어플리케이션이냐 어떤 방식을 구현할 것이냐에 따라 같은 데이터라도 저장하는 방식이 달라질 수 있다.

1. SQL (Structured Query Language)

구조화 질의어라 해석되며 말 그대로 정해진 구조에 따라 구성되어 있다.

  • 관계형 데이터베이스 관리 시스템(relational database management system, RDBMS)

image

데이터들을 원하는 방식대로 분류해 table 별로 저장한다. 각 데이터들은 entity라고 불리며 primary key 값을 갖는다. 우리는 다른 table에서 이 pk 값을 불러와 두 table을 연결시킬 수 있다. (foreign key)

+ SQL 장점

명확하게 정의된 스키마, 데이터 무결성 보장 관계는 각 데이터를 중복없이 한번만 저장

+ SQL 단점

덜 유연함. 데이터 스키마를 사전에 계획하고 알려야 함. (나중에 수정하기 힘듬) 관계를 맺고 있어서 조인문이 많은 복잡한 쿼리가 만들어질 수 있음 대체로 수직적 확장만 가능함

2. Nosql (Not Only Sql)

데이터를 그냥 한군데에 몰아서 넣는다고 생각하면 된다. (embeded) data는 document라고 불리며 그들을 모아놓은것을 collection이라한다.

글 처음 데이터의 형태이며 이후 원하는 값을 추가로 넣을 수 있다.

+ NoSQL 장점

스키마가 없어서 유연함. 언제든지 저장된 데이터를 조정하고 새로운 필드 추가 가능 데이터는 애플리케이션이 필요로 하는 형식으로 저장됨. 데이터 읽어오는 속도 빨라짐 수직 및 수평 확장이 가능해서 애플리케이션이 발생시키는 모든 읽기/쓰기 요청 처리 가능

+ NoSQL 단점

유연성으로 인해 데이터 구조 결정을 미루게 될 수 있음 데이터 중복을 계속 업데이트 해야 함 데이터가 여러 컬렉션에 중복되어 있기 때문에 수정 시 모든 컬렉션에서 수행해야 함 (SQL에서는 중복 데이터가 없으므로 한번만 수행이 가능)

SQL 데이터베이스 사용이 더 좋을 때

관계를 맺고 있는 데이터가 자주 변경되는 애플리케이션의 경우 NoSQL에서는 여러 컬렉션을 모두 수정해야 하기 때문에 비효율적 변경될 여지가 없고, 명확한 스키마가 사용자와 데이터에게 중요한 경우

NoSQL 데이터베이스 사용이 더 좋을 때

정확한 데이터 구조를 알 수 없거나 변경/확장 될 수 있는 경우 읽기를 자주 하지만, 데이터 변경은 자주 없는 경우 데이터베이스를 수평으로 확장해야 하는 경우 (막대한 양의 데이터를 다뤄야 하는 경우)


  • One-to-One - Prefer key value pairs within the document
  • One-to-Few - Prefer embedding
  • One-to-Many - Prefer embedding
  • One-to-Squillions - Prefer Referencing
  • Many-to-Many - Prefer Referencing

General Rules for MongoDB Schema Design:

  • Rule 1: Favor embedding unless there is a compelling reason not to.
  • Rule 2: Needing to access an object on its own is a compelling reason not to embed it.
  • Rule 3: Avoid joins and lookups if possible, but don’t be afraid if they can provide a better schema design.
  • Rule 4: Arrays should not grow without bound. If there are more than a couple of hundred documents on the many side, don’t embed them; if there are more than a few thousand documents on the many side, don’t use an array of ObjectID references. High-cardinality arrays are a compelling reason not to embed.
  • Rule 5: As always, with MongoDB, how you model your data depends entirely on your particular application’s data access patterns. You want to structure your data to match the ways that your application queries and updates it.

https://www.mongodb.com/developer/article/mongodb-schema-design-best-practices/

Updated: