World Wide Web의 가장 큰 사이트는 어떤 데이터베이스에서 실행됩니까?
이 질문은 주요 웹 사이트에서 사용하는 데이터베이스 및 구성 목록의 역할을하며 웹 사이트를 Twitter, Facebook 또는 Google의 크기로 확장하려는 모든 사람에게 훌륭한 참고 자료가 될 것입니다.
답변을 최소한으로 유지하고 사용 된 출처를 인용하십시오.
편집하다:
또한 보다 쉬운 검색을 위해 웹 사이트 이름과 데이터베이스를 모두 굵게 표시 하십시오 .
- MyRocks가있는 MySQL . 좋아요, 댓글 및 공유와 같은 사용자 정보 및 소셜 활동을 저장하는 데 사용됩니다.
- Hive (Hadoop 용 데이터웨어 하우스, 테이블 및 hiveQL이라는 SQL 변형 지원) "간단한 요약 작업, 비즈니스 인텔리전스 및 기계 학습 및 기타 여러 응용 프로그램"에 사용
- Cassandra (다차원, 분산 키-값 저장소). 현재 Facebook의 비공개 메시지에 사용됩니다.
현재 Hive 데이터 저장소가있는 단일 클러스터에서 610 개 (곧 1000 개) Hadoop 노드를 실행 중입니다. Hive와 Cassandra는 모두 Facebook에 의해 오픈 소스되었습니다.
Facebook 통계 :
- 2 억 명 이상의 활성 사용자
- 1 억 명 이상의 사용자가 매일 최소 한 번 Facebook에 로그인합니다.
- 3 천만 명 이상의 사용자가 하루에 한 번 이상 상태를 업데이트합니다.
- 평균 사용자는 사이트에 120 명의 친구가 있습니다.
출처 :
- http://www.dbms2.com/2009/05/11/facebook-hadoop-and-hive/
- http://www.facebook.com/note.php?note_id=89508453919
- http://www.facebook.com/press/info.php?statistics
- http://hadoop.apache.org/hive/
- http://wiki.apache.org/hadoop/Hive/Design
- http://www.facebook.com/note.php?note_id=24413138919
- https://code.facebook.com/posts/190251048047090/myrocks-a-space-and-write-optimized-mysql-database
스택 오버플로 -SQL Server.
Jeff Atwood는 이에 대한 멋진 블로그 게시물을 작성했습니다.
https://blog.stackoverflow.com/2008/09/what-was-stack-overflow-built-with/
- Oracle (관계형 데이터베이스)
- MySQL (관계형 데이터베이스)
고 가용성을 위해 여러 서버에 복제 된 데이터베이스. 각 서비스는 고유 한 도메인 별 DB를 사용합니다.
LinkedIn 통계 :
- 2,200 만 회원
- 4 백만 명 이상의 순 방문자 / 월
- 4 천만 페이지 뷰 / 일
- 2 백만 검색 / 일
출처 :
Flickr 는 MySQL을 사용합니다 .
YouTube 는 MySQL을 사용 하지만 Google의 BigTable 로 이동하고 있습니다 .
Myspace 는 SQL Server를 사용합니다 .
Wikipedia 는 MySQL을 사용합니다 .
- SQL Server (놀랍지 않음)
Microsoft.com 통계 :
- 월 2 억 5 천만 고유 방문.
- 7 천만 페이지 뷰 / 일.
- 15,000 개 연결 / 초.
- 총 80 개의 웹 서버에 대해 평균 35,000 개의 동시 연결을 유지합니다.
출처 :
- PostgreSQL (수정 됨)-클라이언트는 클러스터의 모든 노드 (또는 정책 제한 하위 집합)에 연결할 수 있습니다. 쿼리는 클라이언트에서 연결하기로 선택한 서버로 흐릅니다. 해당 노드의 SQL 컴파일러는 해당 단일 노드에서 쿼리를 컴파일하고 최적화합니다 (병렬 처리 없음).
Yahoo.com 통계 :
- 하루에 240 억 개의 이벤트
- 2 페타 바이트, 최대 규모의 데이터베이스 (2008 년 3 월)
출처:
- http://perspectives.mvdirona.com/2008/05/23/PetascaleSQLDBAtYahoo.aspx
- http://www.computerworld.com/s/article/9087918/Size_matters_Yahoo_claims_2_petabyte_database_is_world_s_biggest_busiest
- MySQL (Relational Database).
- Cassandra (Multi-dimensional, distributed key-value store). Twitter is just "beginning to use Cassandra at Twitter" (see second source).
In May 2008, Twitter had 1 MySQL instance for writes with multiple MySQL slave instances for reads.
Twitter stats:
- Total Users: 1+ million
- Total Active Users: 200,000 per week
- Total Twitter Messages: 3 million/day
- 5% of Twitter users account for 75% of all activity
- 72.5% of all users joining during the first five months of 2009
Sources:
- http://blog.twitter.com/2008/05/its-not-rocket-science-but-its-our-work.html
- http://blog.evanweaver.com/articles/2009/07/06/up-and-running-with-cassandra/
- http://www.sysomos.com/insidetwitter/
- http://www.techcrunch.com/2008/04/29/end-of-speculation-the-real-twitter-usage-numbers/
Digg
- MySQL (Relational Database) for scaling out reads
- MemcacheDB (Key-Value Store) for scaling out writes
Both data stores are distributed across multiple servers.
Digg stats:
- 30M users
- 26M uniques per month
- 2 billion requests a month
- 13,000 requests a second, peak at 27,000 requests a second.
Sources:
- http://www.krisjordan.com/2008/09/18/joe-stump-scaling-digg-and-other-web-applications/
- http://highscalability.com/scaling-digg-and-other-web-applications
Google uses BigTable: http://research.google.com/archive/bigtable.html
PlentyOfFish.com using Microsoft SQL Server:
https://blog.codinghorror.com/scaling-up-vs-scaling-out-hidden-costs/
'IT Share you' 카테고리의 다른 글
저장소의 어디에서나 ipython 노트북 체크 포인트를 무시하는 방법 (0) | 2020.11.17 |
---|---|
저장소의 어디에서나 ipython 노트북 체크 포인트를 무시하는 방법 (0) | 2020.11.17 |
Node.js / 서버 측 자바 스크립트에서 XSS 방지 (0) | 2020.11.17 |
현재 날짜를 열의 기본값으로 사용 (0) | 2020.11.17 |
자바의 메모리 스트림 (0) | 2020.11.17 |