파생 데이터12장: 데이터 시스템의 미래데이터 통합문제가 주어졌을때 모든 문제를 만족하는 하나의 해결책은 없지만 상황에 따라 적절한 서로 다른 접근법이 많이 있다
파생 데이터에 특화된 도구의 결합
포스트그레스큐엘 같은 디비는 간단한 애플리케이션 만들기에 충분한 전문 ...
Simple Python Version Management: pyenvjenv와 같은 역할을 하는 pyenv를 소개한다.
설치123brew updatebrew install pyenv
사용법123pyenv install 3.10pyenv global 3.10
업그레 ...
파생 데이터11장: 스트림 처리“복잡하지만 잘 작동하는 시스템은 예외 없이 간단하지만 잘 작동하는 시스템으로부터 발전한다.이 명제는 역도 참이다. 처음부터 복잡하게 설계된 시스템은 절대 작동할 리도 없고 작동하게 만들지도 못한다.” 존갈, 체계론
일괄처리는 입력으로 파 ...
파생 데이터1부와 2부에서는 디스크에 저장된 데이터의 레이아웃부터 결함이 있는 상황에서의분산된 일관성의 한계까지 분산 데이터베이스로 가기위해 고려해야 할 모든 주요사항을 밑바닥부터 다뤘다
데이터를 저장하고 처리하는 시스템
레코드 시스템 : 데이터를 레코드 단위로 저장 ...
분산 데이터09장: 일관성과 합의결함의 가장 간단한 해결방법은 서비스가 실패하도록 두고 사용자에게 오류메시지를 보내는것
내결함성을 지닌 시스템을 구축하는 가장 좋은 방법은 유용한 보장을 해주는 범용 추상화를 찾아 이를 구현하고 애플리케이션에서 이 보장에 의존하게 하는것 ...
분산 데이터08장: 분산 시스템의 골칫거리엔지니어로서의 우리의 임무는 모든 게 잘못되더라도 제 역할을 해내는 시스템을 구축하는것
결함과 부분 장애하드웨어가 올바르게 동작하면 같은 연산은 항상 같은 결과를 낸다(결정적이다)
부분 장애(partial failure) : 분 ...
분산 데이터07장: 트랜잭션트렌젝션은 데이터베이스의 여러문제를 단순화하는 메커니즘으로 채택돼 왔다트랜젝션은 애플리케이션에서 몇개의 읽기와 쓰기를 하나의 논리적 단위로 묶는 방법이다.데이터베이스에 접속하는 애플리케이션에서 프로그래밍 모델을 단순화하려는 목적으로 만든것이다 ...
분산 데이터06장: 파티셔닝데이터셋이 매우 크거나 질의 처리량이 매우 높다면 복제만으로는 부족하고 데이터를 파티션으로 쪼갤 필요가 있다 이작업을 샤딩이라고도 한다
파티션을 나눌때 보통 각 데이터 단위가 하나의 파티션에 속한다
파티셔닝의 주된 이유 : 확장성
파티셔닝과 ...
우분투 NVIDIA 드라이버 설치(ubuntu-drivers 사용)ubuntu-drivers를 사용하여 NVIDIA 드라이버를 설치하는 방법을 알아보자.
드라이버 버전 확인1cat /proc/driver/nvidia/version
드라이버 확인데스크탑1sudo ubu ...