Chuyện là Dai thấy trang web này https://web.scraper.workers.dev
Cho scrape nội dung qua CSS selector.
Chi tiết https://github.com/adamschwartz/web.scraper.workers.dev
Dai đêm về chế lại thành tool leech =))
Thử với 3 trang web bachngocsach.com, vi.blogtamsu.com (truyenfull.vn), truyen.tangthuvien.vn
Cơ mà phát hiện nó chỉ xuống dòng với thẻ <p>, còn <br> nó bỏ luôn. Nên 2 trang vi.blogtamsu.com (truyenfull.vn), truyen.tangthuvien.vn leech thì nó thành 1 hàng duy nhất, chỉ bachngocsach.com là ok