Breaking News
recent

리눅스 wget 패키지 사용법


 wget(World Wide Web Get)웹 서버로 부터 원하는 웹 사이트의 정보를 가져오는 역할을 합니다. GUI 환경에서는 굳이 사용되지 않지만 CLI 환경을 사용하신다면 편리하게 사용하실 수 있습니다.



1. wget이 없을 경우

 wget은 GNU 프로젝트에서 탄생하였습니다. 많은 리눅스 배포판에서 기본적으로 wget을 포함하여 배포하고 있습니다. 하지만 wget 패키지를 포함하지 않고 최소한의 기능만을 사용하는 리눅스로 다운받으셨을 경우 별도로 wget 패키지를 다운로드 받으셔야 합니다.

 대부분의 사용자는 리눅스 배포판을 설치할 때 사용 편의를 위하여 패키지들을 포함한 파일로 다운로드 받아서 설치하기에 wget이 없다면 당황하실 수도 있기에 참고하여 주시면 되겠습니다.

 아래는 데비안 계열 리눅스의 패키지 리스트 중 wget이 존재하는지 확인하여 줍니다.

우분투에서 wget 패키지 다운로드 가능 여부 확인
< 우분투에서 wget 패키지 다운로드 가능 여부 확인 >

2. wget 사용법

 wget은 HTTP, HTTPS, FTP 프로토콜을 이용하여서 다운로드 받을 수 있도록 되어 있습니다. 따라서 http:// https:// ftp://로 시작하는 URL에서는 원하는 파일 또는 소스를 다운 받으실 수 있습니다.

 사용법은 간단합니다. 그냥 wget [URL]을 입력하시면 되겠습니다. 그 외 자세한 설명은 'man wget'이나 'wget -help'를 활용하시면 되겠습니다. 아니면 커피닉스에 소개되어 있는 Wget 완벽 정리를 참고하시면 되겠습니다.

3. wget 활용법

 wget의 옵션을 사용하여 이용할 수도 있지만, 최신의 리눅스 환경 대부분에서는 굳이 복잡하게 옵션을 사용하여 이용하는 경우가 많이 없을겁니다. 그래서 wget에 대한 사용법 보다는 이번에 말씀드리는 활용법이 더 실용적이지 않을까 합니다.

 첫 번째 활용 방법은 파일 다운로드가 있습니다. 이미 FTP 프로토콜에서 사용 가능하다고 말씀드렸기에 파일을 다운 받을 수 있을거라고 예상하신 분들도 계실겁니다.

 예를 들어 만약 웹 사이트에 다운로드 받은 A 파일이 필요한데 USB로 옮길려면 번거롭습니다. 하지만 다운로드 받은 웹 사이트의 A 파일 URL만 알고 있다면 손쉽게 다운로드가 가능합니다. 아래는 이해를 돕기 위한 우분투  이미지 파일을 다운로드하는 방법이기에 시간이 지남에 따라 경로가 변경될 수 있습니다. 단순히 예시로서만 이해하시면 되겠습니다.

  • Step 01. 우분투 다운로드 페이지에 접속
  • Step 02. 우분투 이미지를 다운 받는 URL을 확인
    • - URL은 마우스 우 클릭으로 확인하거나 브라우저의 '개발자 모드'를 이용하여 확인 가능
    • - 다운로드 경로 : http://releases.ubuntu.com/14.04.3/ubuntu-14.04.3-desktop-amd64.iso
  • Step 03. wget을 이용하여 다운로드 시작
    • - wget http://releases.ubuntu.com/14.04.3/ubuntu-14.04.3-desktop-amd64.iso

wget을 이용한 Ubuntu ISO 파일 다운로드
< wget을 이용한 Ubuntu ISO 파일 다운로드 >

 두 번째 활용 방법은 HTML분석입니다. wget은 웹 페이지의 HTMl 소스를 그대로 가져와 주기에 HTML 분석을 위해 소스를 다운받으실 수 있습니다.

 아래는 wget을 이용하여 제 블로그의 HTML을 다운로드 받아서 vi를 이용하여 보는 모습입니다. 특별한건 없기에 별다른 설명은 생략하겠습니다.

wget을 이용한 HTML 소스 다운로드
< wget을 이용한 HTML 소스 다운로드 >
wget으로 다운로드 받은 HTML을 분석하는 화면
< wget으로 다운로드 받은 HTML을 분석하는 화면 >


 세 번째 활용 방법은 사이트의 디렉터리 구조를 가져오는 -r 옵션을 사용합니다. 다만, 제가 웹 서버를 따루 운영하고 있지 않기에 정확한 확인은 불가능하여 확실하지는 않지만 아마 보안상의 이유로 디렉터리  구조를 완벽하게 파악하기는 불가능할 것으로 예상됩니다. 따라서 대략적으로만 파악되지 않을까 생각됩니다.

 아래는 보고 계신 이 블로그의 주소를 입력하여 -r로 다운로드 받는 예시입니다. 이 블로그의 주소가 디렉터리 이름이 되어있습니다. 내부에 접근하여 디렉터리 구조를 확인하면 파일과 또 다른 디렉터리가 위치하여 있습니다. 

 제가 글을 발행할 때 보면 블로그 주소 뒤에 항상 [2016/01/xxxx] 형태로 되어 있기에 이 디렉터리의 구조는 확실히 맞다고 생각됩니다.


이 블로그를 wget -r 로 다운받았을 때의 구조
< 이 블로그를 wget -r 로 다운받았을 때의 구조 >



Su-hyeon Jo

Su-hyeon Jo

댓글 없음 :

댓글 쓰기

Google Blogger 서비스는 비밀 댓글을 지원하지 않기에 비공개를 원하시면 메일로 문의주시기 바랍니다. MAIL TO.

대또(Dae DDo). Powered by Blogger.