< 모든 개발자를 위한 HTTP 웹 기본 지식 > 섹션 7. HTTP 헤더1 - 일반 헤더
< 1. HTTP 헤더 개요 >
'일반적으로 사용되는 헤더'들 과 '캐시와 조건부 요청되는 헤더들'
Http 헤더
용도
-> HTTP 전송에 필요한 모든 부가정보
ex. 메세지 바디의 내용, 메세지 바디의 크기, 압축, 인증, 요청 클라이언트, 서버 정보, 캐시 관리 정보 등
-> '표준 헤더' 가 너무 많음
-> 필요시 임의의 헤더 추가 가능
helloworld : hihi
HTTP 헤더 분류
General 헤더 : 메세지 전체에 적용되는 정보 ex. Connection : close
Request 헤더: 요청 정보 ex. User-Agent : Mozilla/5.0 (Macintosh;)
Respose 헤더 : 응답 정보, ex. Server: Apache
Entity 헤더 : 엔티티 바디 정보, ex.. Content-Type : text/html, Content-Length: 3423
RFC723x 변화
엔티티(Entity) -> 표현 ( Representation)
Representation = representation Metadata + Representation Data
표현 = 표현 메타데이터 + 표현 데이터
< HTTP BODY - message body - RFC7230최신 >
-> 메세지 본문 (message body)을 통해 표현 데이터 전달
-> 메시지 본문 = '페이로드(payload)'
-> '표현'은 요청이나 응답에서 전달할 실제 데이터
-> '표현 헤더'는 표현 데이터를 해석할 수 있는 정보 제공
-> 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
참고 : 표현 헤더는 표현 메타데이터와, 페이로드 메세지를 구분해야 하지만, 여기서는 생략
< 2. 표현 >
"HTML 이라는 표현으로 전달할 것인가, JSON이라는 표현으로 전달할 것인가. XML로 전달할 것인가."
1. Content-Type : 표현 데이터의 형식 - 미디어 타입, 문자 인코딩
ex. Content-Type: text/html; charset=utf-8
Content-Type: application/json
Content-Type: image/png
2. Content-Encoding : 표현 데이터의 압축 방식
-> 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
-> 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
ex. gzip, deflate, identity
3. Content-Language : 표현 데이터의 자연 언어. 한국어 영어 ex. ko, en, en-US
4. Content-Length : 표현 데이터의 길이 - 바이트 단위
-> Transger-Encoding을 사용하면 Content-Length를 사용하면 안됨.
'표현 헤더' 는 전송, 응답 둘다 사용
< 3. 콘텐츠 협상 >
협상( 콘텐츠 네고시에이션 ) - 클라이언트가 선호하는 표현 요청
Accept : 클라이언트가 선호하는 미디어 타입 전달
Accept-Charset : 클라이언트가 선호하는 문자 인코딩
Accept-Encoding : 클라이언트가 선호하는 압축 인코딩
Accept-Language : 클라이언트가 선호하는 자연 언어
"협상 헤더는 요청시에만 사용"
협상과 우선순위1 - Quality Values(q)
-> Quality Values(q) 값 사용
-> 0~1, 클수록 높은 우선순위
-> 생략하면 1
GET /event
Accept-Language: ko-KR,ko:q=0.9,en-US;q=0.8,en;q=0.7
1. ko-KR;q=1(q생략)
2.ko;q=0.9
3.en-US;q=0.8
4.en:q=0.7
협상과 우선순위2 - Quality Values(q)
-> 구체적인 것이 우선한다.
협상과 우선순위3
-> 구체적인 것을 기준으로 미디어 타입을 맞춘다.
< 4. 전송 방식 >
단순 전송 - Content Length
HTTP/1.1 200 OK
Content-Type: text/html;charset=UTF-8
Content-Length: 3424
<html>
<body>...</body>
</html>
압축 전송 - Content Encoding
HTTP/1.1 200 OK
Content-Type: text/html;charset=UTF-8
Content-Encoding: gzip
Content-Lengtn: 521
분할 전송 - Trensfer Encoding(chunked) -> content length를 넣으면 안된다.
HTTP/1.1 200 OK
Content-Type: text/plain
Transfer-Encoding: chunked
5
Hello
5
World
0
/r/n
범위 전송 - Range, Content-Range -> 범위를 지정해서 요청할 수 있다.
HTTP/1.1 200 OK
Content-Type: text/plain
Content-Range: bytes 1001-2000 / 2000
< 5. 일반 정보 >
일반 정보
From : 유저 에이전트의 이메일 정보
-> 검색 엔진 같은곳에서, 주로 사용
-> 요청에서 사용
******Referer : 이전 웹 페이지 주소******
-> 현재 요청된 페이지의 이전 웹 페이지 주소
-> A에서 B로 이동하는 경우 B를 요청할 때 Referer:A를 포함해서 요청
-> Referer를 사용해서 유입 경로 분석 가능
-> '요청'에서 사용
User - Agent : 유저 에이전트 애플리케이션 정보
-> 클라이언트의 애플리케이션 정보(웹 브라우저 정보)
-> 통계 정보
-> 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
-> 요청에서 사용
Server : 요청을 처리하는 '오리진 서버'의 소프트웨어 정보 -> 응답에서 사용
오리진 서버 : 진짜 나의 요청이 있는 마지막 서버. 나의 표현 데이터 만들어줌.
Date : 메시지가 생성된 날짜 -> '응답'에서만 사용
< 6. 특별한 정보 >
1. Host : 요청한 호스트 정보(도메인) - 필수헤더
-> 요청에서 사용
-> 필수값
-> 하나의 서버가 여러 도메인을 처리해야 할때
-> 하나의 IP주소에 여러 도메인이 적용되어 있을 때
: 가상 호스트를 통해 여러 도메인을 한번에 처리할 수 있는 서버. 실제 어플리케이션이 여러개 구동될 수 있다.
but 요청을 할때 서버에서 어디로 들어가야 할지를 모른다
그래서 헤드에 호스트 정보(도메인)을 넣어준다 -> 가상 호스팅 -> 서버안에서 '표'를 만들 수 있다
GET /hello HTTP/1.1
Host: aaa.com
2. Location : 페이지 리다이렉션
-> 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동(리다이렉트)
-> 응답코드 3xx에서 설명
-> 201(Created) : Location 값은 요청에 의해 생성된 리소스 URI
-> 3xx (Redirection) : Location 값은 요청을 자동으로 리다이렉션 하기 위한 대상 리소스를 가리킴
3. Allow : 허용 가능한 HTTP 메서드
-> 405(Method Not Allowed)에서 응답에 포함해야함
-> Allow : GET,HEAD, PUT
4. Retry-After : 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
-> 503 (Service Unavailable) : 서비스가 언제까지 불능인지 알려줄 수 있음
-> Retry - After : Fri, 31 Dec 1999 23:59:59 GMT(날짜 표기)
-> Retry - After : 120 (초단위 표기)
< 7. 인증 >
Authorization : 클라이언트 인증 정보를 서버에 전달 -> Basic xxxxxxxx
WWW-Authenticate : 리소스 접근시 필요한 인증 방법 정의
-> 401 Unauthorized 응답과 함께 사용
*******< 8. 쿠키 >******
Set-Cookie : 서버에서 클라이언트로 쿠키 전달(응답)
Cookie : 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청시 서버로 전달
" 쿠키 미사용시 로그인을 하고 /welcom HTTP 를 하여도 "안녕하세요 홍길동님이 아닌 안녕하세요 '손님'으로 응답한다."
Stateless
-> HTTP는 무상태(Stateless) 프로토콜이다.
-> "클라이언트와 서버가 요청과 응답을 주고 받으면 연결이 끊어진다."
-> "클라이언트가 다시 요청하면 서버는 이전 요청을 기억하지 못한다."
-> "클라이언트와 서버는 서로 상태를 유지하지 않는다."
1. 쿠키 미사용시
대안 - 모든 요청에 '사용자 정보' 포함
GET /welcome?user=홍길동 HTTP/1.1
모든 요청에 정보를 넘길시 문제점
-> 모든 요청에 사용자 정보가 포함되도록 개발 해야함
-> 브라우저를 완전히 종료하고 다시 열면?
2. 쿠키 사용시 - 로그인
"서버에서 HTTP/1.1 200 OK
Set-Cookie: user= 홍길동
홍길동님이 로그인 했습니다"
--> 쿠키 저장소에 저장. user=홍길동 ( 웹 브라우저 내에는 쿠키 저장소가 있다 )
이후에는 로그인 할때마다 "GET /welcome HTTP/1.1. --> 쿠키저장소에서 조회하여 내보낸다.
Cookie: user=홍길동 "
--> 모든 요청에 쿠키 정보 자동 포함 ex. welcome, board, order, xxx 등으로 보내도 메커니즘 같아 가능
3. 쿠키
쿠키를 서버에서 세팅할때 -> set-cookie: sessionId(세션 아이디)=abcde1234; expires=Sat(만료되는 시간), 26-Dec-2020
00:00:00 GMT; Path(경로에 대해서 허용해 준다.)=/; domain(이러한 도메인에서 쿠키가 허용된
다)=.google.com; Secure(쿠키의 보안정보를 넣는다)
-> 사용자 '로그인 세션관리 할때 많이 쓰인다'. '세션 아이디에 대한 세션키 보관 '
-> 광고 정보 트래킹(광고 알고리즘 추적)
-> 쿠키 정보는 항상 서버에 전송됨
-> 네트워크 트래픽 추가 유발
-> 최소한의 정보만 사용(세션 id, 인증 토큰)
-> 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 '웹 스토리지'( localStorage, sessionStorage) 참고
-> 보안에 민감한 데이터는 저장하면 안됨 ( 주민번호, 신용카드 번호 등등)
쿠키 - 생명주기 - Expires, max-age
-> Set-Cookie: expires=Sat, 26-Dex-2020 04:39:21 GMT
-> 만료일이 되면 쿠키 삭제
-> Set-Cookie: max-age=3600 (3600초)
-> 0이나 음수를 지정하면 쿠키 삭제
-> 세션 쿠키 : 만료 날짜를 생략하면 브라우저 종료시 까지만 유지
-> 영속 쿠키 : 만료 날짜를 입력하면 해당 날짜까지 유지
쿠키 - 도메인 Domain
-> 쿠키가 아무 사이트에나 생기면 큰일날것
-> domain=example.org
-> 명시 : 명시한 문서 기준 도메인 + 서브 도메인 포함
-> domain=example.org를 지정해서 쿠키 생성
-> example.org는 물론이고 dev.example.org도 쿠키 접근
생략: 현재 문서 기준 도메인만 적용
-> example.org에서 쿠키를 생성하고 domain 지정을 생략
-> example.org에서만 쿠키 접근
-> dev.example.org는 쿠키 미접근 ( 하위 도메인에선 쿠키접근 불가능)
쿠키 - 경로 Path
-> path=/home
-> 이 경로를 포함한 '하위 경로 페이지'만 쿠키 접근
-> 일반적으로 path=/ 루트로 지정
ex. path=/home 지정
/home -> 가능
/home/level1 -> 가능
/home/level1/level2 -> 가능
/hello -> 불가능
쿠키 - 보안 - Secure, HttpOnly, SameSite
Secure
-> 쿠키는 http,https를 구분하지 않고 전송
-> Secure를 적용하면 https인 경우에만 전송(보안 추가)
HttpOnly
-> Xss 공격방지
-> 자바스크립트에서 접근 불가(document.cookie)
-> HTTP 전송에만 사용
SameSite
-> XSRF 공격 방지
-> 요청 도메인과 쿠키에 설정된 도메인과 같은 경우만 쿠키 전송