Skip to content

A121321231232/naver-blog-original-image-crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

52 Commits
 
 
 
 

Repository files navigation

네이버 블로그 원본 이미지 크롤러

네이버 블로그의 원본 이미지를 다운로드할 수 있는 이미지 크롤러

2023-02-18 업데이트

  • 폴더 이름 맨 뒤에 마침표(.)가 있으면 튕기는 문제 해결
  • 블로그 게시글 제목(폴더 이름)에 /:*?"<>| 가 있으면 공백으로 대체되고 맨 앞이나 뒤에 공백이 있으면 삭제됨, 마침표가 맨 뒤에 있으면 삭제됨

2023-02-17 업데이트

  • 이름과 바이트 수가 같은 이미지가 다운로드할 폴더에 존재하면 그 이미지는 다운로드하지 않고 건너뛰도록 개선함
  • 현재 파일 이름 저장 방식에 맞춰서 파일 이름이 같은지 확인함
  • 예: 2번 파일 이름 저장 방식을 사용하는 중이면 1번이나 3번 파일 이름 저장 방식으로 다운받은 이미지가 폴더에 존재해도 감지하지 못함

2023-02-05 업데이트

  • 이름이 같은 파일이 여러 개 있을 경우 그 중 하나만 다운되는 문제가 발견되어 해결을 위해 파일 이름을 지정할 수 있는 옵션 추가 (기본 설정은 파일 이름을 무시하고 숫자로 다운받는 것)

2022-10-31 업데이트

  • 작은 카테고리 개별로 다운받는 대신 큰 카테고리 전체를 한 번에 다운받을 수 있도록 기능 추가
  • 게시글 주소 대신에 카테고리 주소로도 다운받을 수 있도록 기능 추가
  • setting.txt에 아무것도 적혀 있지 않은 상태에서 저장 경로 변경을 시도하였다가 취소했을 때 setting.txt에 현재 경로가 적히지 않도록 변경

2022-08-11 업데이트

  • iframe 없는 링크에서 카테고리 다운로드가 작동하지 않는 오류 수정
  • 폴더를 생성할 때 양 끝의 공백을 없애지 않아 오류가 생겼던 문제 수정
  • README 가독성 수정 및 내용 추가
  • 카테고리 범위를 입력하기 전에 카테고리 내 게시글 갯수를 표시해 주도록 변경
  • 다운로드를 할 때 링크를 여러 개 입력할 수 있도록 변경
  • 사진 파일 이름이 한글로 되어 있어도 깨지지 않도록 url 디코딩을 하도록 변경

기능

1. 다운로드 - 입력한 네이버 블로그 게시글 링크의 원본 이미지를 다운

  • 사이에 띄어쓰기를 하면 여러 링크를 한 번에 입력할 수 있음(띄어쓰기는 한 칸만 해야 함)
예시
 https://blog.naver.com/blogpeople/222844066273 https://blog.naver.com/blogpeople/222843909996
  • 링크를 입력할 때 게시글 번호가 포함되게 입력하여야 함
올바른 네이버 블로그 링크 예시
 https://blog.naver.com/blogpeople/222844066273 #PC 버전
 https://blog.naver.com/PostView.naver?blogId=blogpeople&logNo=222844066273&categoryNo=72&parentCategoryNo=-1&viewDate=&currentPage=&postListTopCurrentPage=&isAfterWrite=true #PC 버전
 https://m.blog.naver.com/blogpeople/222844066273 #모바일 버전
잘못된 네이버 블로그 링크 예시(게시글 링크가 포함되어 있지 않음)
 https://blog.naver.com/blogpeople
 https://blog.naver.com/PostList.naver?blogId=blogpeople&skinType=&skinId=&from=menu&userSelectMenu=true
 https://m.blog.naver.com/blogpeople

2. 개별 카테고리 다운로드 - 입력한 네이버 블로그 게시글 링크와 같은 작은 카테고리거나 입력한 카테고리 링크의 카테고리에 포함되는 모든 게시글의 원본 이미지를 다운

  • 카테고리 다운로드는 링크를 여러 개 입력할 수 없음
  • 게시글 링크를 입력하면 그 게시글과 같은 작은 카테고리에 속하는 모든 게시글의 원본 이미지를 다운받음
  • 작은 카테고리 링크를 입력하면 그 작은 카테고리에 포함되는 모든 게시글의 원본 이미지를 다운받음
  • 큰 카테고리 링크를 입력하면 그 큰 카테고리 내에서 작은 카테고리에 포함되지 않은 모든 게시글의 원본 이미지를 다운받음 (큰 카테고리 전체를 다운받는 것이 아님) 스크린샷(31)
올바른 카테고리 링크 예시
 https://blog.naver.com/blogpeople/221053474321 #PC 버전
 https://blog.naver.com/PostList.naver?blogId=blogpeople&from=postList&categoryNo=51 #PC 버전
 https://m.blog.naver.com/blogpeople?categoryNo=51#postlist_block #모바일 버전
  • 범위를 지정하여 다운로드 가능(범위를 입력하지 않으면 전부 다운)
범위 입력 예시
3 10    -3번부터 10번까지
0 7     -처음부터 7번까지
5 0     -5번부터 끝까지
0 0     -전부
2 -1    -2번부터 끝에서 1번까지
-10 9   -끝에서 10번부터 9번까지
-9 -2   -끝에서 9번부터 끝에서 2번까지

입력하지 않고 그냥 엔터를 치면 전부 다운

3. 전체 카테고리 다운로드 - 입력한 큰 카테고리 주소에 포함되는 모든 게시글의 원본 이미지를 다운

  • 게시글 링크는 사용할 수 없고 카테고리 링크로만 다운로드 받을 수 있음
  • 작은 카테고리 링크를 입력하면 작동하지 않으니 큰 카테고리 링크를 입력해야 함
  • 개별 카테고리 다운로드와 같은 방식으로 범위를 지정할 수 있음

4. 저장 경로 변경

  • 저장 경로는 setting.txt에 저장됨
  • 저장 경로가 지정되어 있지 않으면 py파일 또는 exe파일이 있는 경로에 다운받음