티스토리

GARONGURI
검색하기

블로그 홈

GARONGURI

garonguri.tistory.com/m

Garonguri 님의 블로그입니다.

구독자
2
방명록 방문하기
728x90

주요 글 목록

  • Database Chapter 13 - 데이터 과학과 빅데이터 빅데이터 기존 데이터베이스가 저장하고 관리할 수 있는 범위를 넘어서는 대규모 데이터 대규모의 데이터를 저장, 관리하는 기술과 가치 있는 정보를 만들기 위해 분석하는 기술 빅데이터의 특징 (3V) 데이터 양 : 테라바이트 단위 이상의 대량 데이터 속도 : 많은 양의 데이터가 생성, 전달, 처리되는 속도가 빠르다. 다양성 : 정형, 반정형, 비정형의 데이터를 모두 포함한다. 빅데이터 처리 기술 저장 기술 Hadoop(하둡) 대용량 데이터 분산 처리 가능한 자바 기반의 오픈 소스 프레임워크 HDFS에 데이터 저장, MapReduce를 이용해 데이터 처리 오픈 소스이기 때문에 비용이 적게 들고, 분산형이기 때문에 처리 속도가 빠르다. NoSQL 관계 데이터 모델, SQL을 사용하지 않는 데이터베이스 시스템 일관.. 공감수 0 댓글수 0 2022. 4. 1.
  • Database Chapter 12 - 데이터베이스 응용 기술 분산 데이터베이스 시스템 물리적으로 분산된 데이터베이스 시스템을 네트워크로 연결해, 사용자가 논리적으로 '하나의' 중앙 집중식 데이터베이스 시스템처럼 사용할 수 있도록 하는 데이터베이스 시스템 목표 : 분산 데이터 독립성 (분산 투명성 보장되어야 함) 분산 투명성 위치 투명성 : 데이터베이스의 논리적인 이름만으로 데이터에 접근 가능하다. 중복 투명성 : 중복되지 않게 분할해 저장하거나, 데이터를 중복해 저장한다. 단편화 투명성 : 릴레이션을 작은 조각으로 나누고 각 조각을 별개의 릴레이션으로 처리한다. 병행 투명성 : 트랜잭션이 동시에 수행되더라도 결과는 항상 일관성을 유지한다. 장애 투명성 : 시스템에 문제가 발생하더라도 시스템이 작업을 계속 수행할 수 있다. 중앙 집중식 데이터 시스템과 비교했을 때,.. 공감수 0 댓글수 0 2022. 4. 1.
  • Database Chapter 11 - 보안과 권한 데이터 베이스 보안의 목표 조직에서 허가한 사용자만 접근할 수 있도록 통제해 보안을 유지하는 것 보안 유형 물리적 환경에 대한 보안 ex) 자연재해 권환 관리를 통한 보안 ex) 권한이 없는 사용자로부터 보호. '계정이 발급'되어야 함. 운영 관리를 통한 보안 ex) 권한이 있는 사용자로부터 보호. 데이터 무결성이 위반될 가능성을 막기 위함. 사용자가 자신에게 발급된 계정을 가지는 것 -> 접근 권한을 갖는 것. 로그인 -> 권한 확인 순서. 보안을 강화하기 위해 'VIEW'사용 가능. 사용자가 테이블에 직접 접근하지 못하기 때문. 권한/역할 부여와 취소 데이터베이스 객체의 모든 권한은 소유자에게 있다. 데이터 베이스 객체 소유자는 필요에 따라 타 사용자에게 객체에 대한 사용 권한을 SQL문을 통해 부여.. 공감수 0 댓글수 0 2022. 3. 29.
  • Database Chapter 10 - 회복과 병행 제어 트랜잭션이란? 하나의 작업을 수행하는 데 필요한 데이터베이스의 연산들을 모아놓은 것. 데이터 베이스에서 논리적 작업 단위, 데이터 복구 작업 단위, 작업 수행에 필요한 SQL 모임 등으로 표현 가능 데이터베이스의 무결성과 일관성을 보장하기 위해 트랜잭션의 올바른 정의 및 관리가 필요하다. 일반적으로 DELETE, INSERT, UPDATE 등 데이터 변경문의 실행을 트랜잭션을 통해 관리 트랜잭션의 특성 (ACID) A 원자성 트랜잭션을 구성하는 연산이 모두 정상적으로 실행되거나, 하나도 실행되지 않아야 함. all-or-nothing 장애 발생 시 트랜잭션 작업 전의 상태로 되돌려야 한다. 필요 기능 : 회복 기능 C 일관성 트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함. .. 공감수 0 댓글수 0 2022. 3. 29.
  • Database Chapter 9 - 정규화 정규화란? 이상 현상(삽입 이상, 갱신 이상, 삭제 이상)을 제거하면서 데이터베이스를 올바르게 설계해나가는 과정. 릴레이션을 관련이 있는 속성들로만 구상하기 위해 릴레이션을 분해하는 과정. 함수의 종속성 고려해야 함. 목표 : 관련이 없는 함수 종속성은 별도의 릴레이션으로 표현하는 것. 정규형 ? : 릴레이션이 정규화 되어있는 정도 : 차수가 높을 수록 데이터 중복에 의한 이상 현상 발생 빈도가 적다. 비>1>2>3>BCNF>4>5 순으로 포함 관계에 있다. 기본 정규형 제 1 정규형 : 릴레이션에 속한 모든 속성의 도메인이 원자값으로 구성되어 있어야 한다. 제 2 정규형 : 제1정규형에 속해있고, 기본키가 아닌 모든 속성이 기본키에 완전 함수 종속되어야 한다. 제 3 정규형 : 제2정규형에 속해있고, .. 공감수 0 댓글수 0 2022. 3. 26.
  • Database Chapter 8 - 데이터베이스 설계 Database 설계 5단계 1 : 요구 사항 분석 데이터의 종류, 처리 방법 수집 수집한 요구 사항 분석 => 데이터베이스의 용도 결정 결과물 : 명세서 ( E-R diagram으로 표현하면 좋음) 2 : 개념적 설계 사용자 요구 사항을 개념적 데이터 모델로 표현 -> 개념적 모델링 결과물 : 주로 E-R model . -> 개념적 구조, 개념적 스키마 객체 및 속성, 관계, 카디널리티 및 관계 특성, 등을 추출 및 결정한다. 3 : 논리적 설계 DBMS에 적합한 논리적 데이터 모델을 이용해 논리적 구조 설계 -> 논리적 모델링(데이터 모델링) 관계 데이터 모델 주로 사용 결과물 : 논리적 구조, 논리적 스키마 E-R 모델과 관계 데이터 모델의 차이? 릴레이션 스키마 변환 5 규칙 ( E-R 다이어그램.. 공감수 0 댓글수 0 2022. 3. 25.
  • Database Chapter 7 - SQL연산, View View란? 다른 테이블을 기반으로 만들어진 가상 테이블. 데이터를 실제로 저장하지 않고, 테이블에서 사용자가 필요로 하는 부분만 선택하여 만들어놓은 데이터 집합 장점 질의문을 더 쉽게 작성할 수 있다. 데이터의 보안 유지에 도움이 된다. 제공된 필드만 보여줄 수 있기 때문에 데이터를 편리하게 관리할 수 있다. 복잡한 쿼리를 단순화 할 수 있고, 이를 재사용도 가능하다. 단점 한번 정의된 뷰는 변경할 수 없다. 삽입, 삭제, 갱신에 제한사항이 많다. 자신만의 인덱스를 가질 수 없다. 뷰를 변경할 때의 조건 기본 테이블의 기본 키를 구성하는 속성이 포함되지 않은 뷰는 변경할 수 없다. 기본 테이블에 있던 내용이 아니라 집계 함수로 새로 계산된 내용을 포함하고 있는 뷰는 변경할 수 없다. distinct 키.. 공감수 0 댓글수 0 2022. 3. 22.
  • Database Chapter 6 - SQL 관계 대수와 관계 해석 관계 대수 : 원하는 결과를 얻기 위해 데이터의 처리 과정을 순서대로 기술 관계 해석 : 원하는 결과를 얻기 위해 처리를 원하는 데이터가 무엇인지만 기술 관계 대수 연산자 일반 집합 연산자 : 2 가지 조건을 만족해야함. 1. 연산하는 두 릴레이션의 차수가 같아야 한다. (열, atrribute의 개수가 같아야 한다.) 2. 두 릴레이션에서 서로 공통되는 속성(대응되는 속성)의 도메인이 같아야 한다. 합집합 교집합 차집합 카티션 프로덕트 두 릴레이션의 튜플을 모두 연결하여 새로운 튜플을 반환한다. 두 릴레이션이 합병 불가능한 경우에도 카티션 연산은 가능하다. R, S를 카티션 수행 후 릴레이션의 차수 : R차수+S차수, 카디널리티 : R차수*S차수 순수 관계 연산자 셀렉트 릴레이션.. 공감수 0 댓글수 0 2022. 3. 19.
  • Database Chapter 5 - 관계 데이터 모델 E-R model의 개념 Relation이란? E-R model에서 하나의 개체에 관한 데이터를 저장하는 테이블을 Relation 이라고 한다. Relation의 열(속성)을 Atrribute라 한다. Reation의 행을 Tuple이라 한다. 속성 하나가 가질 수 있는 모든 값의 집합을 Domain이라 한다. 차수 한 릴레이션에서 속성의 전체 개수(열의 개수) 카디널리티 한 릴레이션에서 튜플의 전체 개수(행의 개수) 릴레이션 스키마 : 릴레이션의 이름과 릴레이션에 포함된 모든 속성의 이름으로 정의하는 논리적 구조 논리적 구조를 정의하기 때문에 자주 변하지 않는다는 정적인 특징 존재 릴레이션 인스턴스 : 어느 한 시점에 릴레이션에 존재하는 튜플들의 집합. 튜플의 삽입, 삭제, 수정이 자주 발생한다는 동적.. 공감수 0 댓글수 0 2022. 3. 19.
  • Join, subquery JOIN 웬만하면 inner join을 사용하자. 빠르다. 그러나 한 쪽에만 데이터가 있는 경우에는 outer join을 사용해야 생략된 데이터 없이 쿼리를 뽑을 수 있다. SUBQUERY join을 안써도 됨! Example ( Sub : 사번이 100번인 직원) 의 ( Main : 부서명 )고르기 두개의 쿼리를 생각하고 적절한 위치에 합성한다고 생각하면 된다. subquery를 작성하고, 그 다음 이를 기반으로 main query를 작성한다. 위의 경우는 단일 행을 리턴하는 경우임 Example2 다중 행 비교하는 연산자인 in, any, all 등을 사용한다. in : 포함 여부를 묻는다. any : 적어도 하나만 만족하면 true max : 모두 만족하면 true 공감수 0 댓글수 0 2022. 3. 17.
  • Database Chapter 4 - 데이터 모델링 데이터 모델링 현실 세계에 존재하는 데이터를 컴퓨터 세계의 데이터베이스로 옮기는 변환 과정 개념적 모델링 현실 세계 -> 개념 세계 논리적 모델링 개념 세계 -> 데이터 베이스에 저장할 구조로 표현 추상화 데이터 모델 구조 / 연산 / 제약조건 으로 구성 개념적 데이터 모델 E-R diagram 개체(record) : 데이터베이스 안의 데이터 , 속성(field) : 개체가 가지고 있는 고유의 특성. Q. 데이터 베이스의 관계 유형 세가지? - 1:1 관계, 1:다 관계, 다:다 관계 객체 A의 인스턴스 몇개가 객체 B의 인스턴스 몇개와 관계를 맺을 수 있는지에 따라 세 가지 유형으로 구분됨 Q. 레코드, 필드, 테이블이란? - 레코드는 특정 엔터티의 값이고, 필드는 특정 레코드 내의 영역이고, 테이블은.. 공감수 0 댓글수 0 2022. 3. 12.
  • Database Chapter3 - 데이터베이스 시스템 데이터 베이스 시스템 DB와 DBMS를 이용해 필요한 정보를 제공해주는 '전체' 시스템 스키마 (Schema) 데이터베이스에 저장되는 데이터의 구조와 제약 조건. 정의된 스키마에 따라 데이터베이스에 실제로 저장된 값을 인스턴스(instance)라 한다. 3단계 구조 외부 단계(추상화 레벨 가장 높음), 사용자 관점 외부 스키마는 사용자마다 다르므로 여러 개 있을 수 있다. 개념 단계, 총괄 입장 한 데이터베이스에는 하나의 개념 스키마만 존재한다. 내부 단계 (추상화 레벨 가장 낮음), 물리적 구조 내부 스키마는 저장장치에 실제 저장되는 방법을 정의한다. 데이터 독립성 DBMS의 가장 큰 장점 중 하나 하위 스키마가 변경되더라도 상위 스키마가 영향을 받지 않는다. (상위 스키마를 변경시키지 않으며 하위 스.. 공감수 0 댓글수 0 2022. 3. 12.
  • Database Chapter2 - DBMS FileSystem으로 데이터 관리를 할 때의 장단점 장점 별도 구매 비용 절감 단점 데이터 중복성 문제 ( 저장 공간 낭비, 데이터 일관성/무결성 무시) 데이터 종속성 문제 데이터 동시 공유/수정 문제 응용프로그램 개발 어려움 DBMS로 데이터 관리를 할 때 장단점 장점 데이터 중복성 통제 데이터 독립성 확대 데이터 동시공유 가능 데이터 보안성 향상 데이터 무결성 유지 (데이터 값의 정확성) 데이터 표준화 가능 데이터 일관성, 무결성 유지하며 장애 회복 응용프로그램 개발 쉬움 단점 비용 백업, 회복의 어려움 중앙 집중 관리 DBMS 종류 발전 네크워트/관계 -> 계층(RDBMS) -> 객체 -> NoSQL, NewSQL 관계 DBMS ( RDBMS ) 데이터베이스를 테이블 형테로 구성한 관계 데이터 모.. 공감수 0 댓글수 0 2022. 3. 8.
  • Database Chapter 1 - 데이터베이스 개념 정보와 데이터의 차이 데이터 : 단순히 수집한 사실, 값 (자료) 정보 : 데이터를 가공하여 조직한 결과물 정보 처리 데이터를 상황에 맞게 분석, 해석해 관계를 파악하는 것 데이터베이스의 특성 통합 (데이터 중복성 최소화) / 공유 (공용 데이터) / 저장 / 운영 데이터 데이터 베이스의 특징 실시간 접근성/ Continuous Revolution (insert, delete, update) / 동시 공유 / 값(내용)으로 참조 가능 데이터의 분류 1. 정형 데이터 구조화된 데이터 ex) Excel's spreadsheet 2. 비정형 데이터 (Schema) 구조화된 데이터 && 내용에 구조 설명이 함께 존재 parsing (내용을 파악하는 과정) 필요 ex) HTML, XML, JSON 3. 반정형 데.. 공감수 0 댓글수 0 2022. 3. 8.
    728x90
    문의안내
    • 티스토리
    • 로그인
    • 고객센터

    티스토리는 카카오에서 사랑을 담아 만듭니다.

    © Kakao Corp.