In [89]:
import requests
import lxml.html
import re

In [90]:
def main():
    # 여러 페이지에서 크롤링을 위해 Session 사용
    session = requests.Session()  
    # scrape_list_page() 함수를 호출해서 제너레이터를 추출
    response = session.get('http://www.hanbit.co.kr/store/books/new_book_list.html')
    urls = scrape_list_page(response)
    for url in urls:
        response = session.get(url)  # Session을 사용해 상세 페이지를 추출
        ebook = scrape_detail_page(response)  # 상세 페이지에서 상세 정보를 추출
        print(ebook)  # 상세 정보 출력
        break  

In [91]:
def scrape_list_page(response):
    root = lxml.html.fromstring(response.content)
    root.make_links_absolute(response.url)
    for a in root.cssselect('.view_box .book_tit a'):
        url = a.get('href')
        yield url

In [92]:
def scrape_detail_page(response):
    """
    상세 페이지의 Response에서 책 정보를 dict로 추출
    """
    root = lxml.html.fromstring(response.content)
    ebook = {
        'url': response.url,
        'title': root.cssselect('.store_product_info_box h3')[0].text_content(),
        'price': root.cssselect('.pbr strong')[0].text_content(),
        'content': [normalize_spaces(p.text_content())
            for p in root.cssselect('#tabs_3 .hanbit_edit_view p')
            if normalize_spaces(p.text_content()) != '']
    }
    return ebook

In [93]:
def normalize_spaces(s):
    """
    연결된 공백을 하나의 공백으로 변경
    """
    return re.sub(r'\s+', ' ', s).strip()

In [94]:
if __name__ == '__main__':
    main()

{'url': 'https://www.hanbit.co.kr/store/books/look.php?p_code=B7748014142', 'title': '나는 왜 네 말이 힘들까', 'price': '15,120', 'content': ['프롤로그. 다시 배우는 대화', '이 책의 구성', '부탁드립니다', '나의 결심 남기기', 'Chapter 1. 관계를 고통스럽게 만드는 단절의 대화 요소', '자동적 생각 : 대화를 하면 할수록 싸우게 만드는 늪', '인지 오류 :같은 상황에서도 다른 생각을 하는 사람들의 판단 구조', '핵심 신념 : 성격을 만들어내는 굳어버린 생각들', 'Chapter 2. 관계를 행복하게 만드는 연결의 대화 요소', '알아차림 1. 관찰 : 보이는 대로 들리는 대로 묘사하는 능력', '알아차림 2. 감정과 감각: 몸과 마음에서 느껴지는 중요한 신호', '알아차림 3. 핵심욕구와 가치: 우리가 대화하고 행동하는 결정적 이유', '알아차림 4. 요청과 강요 : 평화적 태도와 폭력적 태도의 구별', '알아차림 5. 자기인식 프로세스: 속으로 하는 침묵대화', 'Chapter 3. 상대의 말에 반응하는 듣기 연습', '공감하기 : 사람들의 이야기를 공감하는 마음으로 들어주기 173', '이해하기 : 불편한 말을 번역기를 사용하여 이해하며 들어보기 199', '해석하기 : 비난의 문자와 댓글 건강하게 해석하기 215', 'Chapter 4. 자신의 마음을 표현하는 말하기 연습', '화가 날 때 : 자기 마음을 이해하고 표현하기', '부탁할 때 : 부탁하는 이유를 분명히 알고 나서 상대에게 요청하기', '미안할 때 : 후회되는 마음을 담아 변화된 행동을 상대에게 고백하기', 'Chapter 5. 건강한 관계를 위한 나눔 연습', '거절 다루기 : 거절을 주고받으면서도 상호적 관계 유지하기', '중재하기 : 비난의 말을 욕구의 말로 번역해주기', '감사 나누기 : 고마운 마음을 나누고 능력을 인정해주기', 'Special thanks to...'