Je ne pense pas que curl ait un processeur HTML intégré. Cependant :
lynx --dump <URL>
fait l'affaire.
Si vous souhaitez toujours utiliser curl, vous pouvez utiliser html2text
(disponible dans Ubuntu).
Vous pouvez installer html2text
(un convertisseur HTML vers texte avancé) et l'utilisation est simple :
$ html2text http://example.com/
$ cat file.html | html2text -o file.txt
Installer par :
- Linux :
apt-get install html2text
- OS X :
brew install html2text
Exemple avec curl
:
$ curl -sL google.com | html2text
Search Images Maps Play YouTube News Gmail Drive More ?
Web History | Settings | Sign in
A better way to browse the web
Get Google Chrome
Advanced search Language tools
[Google Search][I'm Feeling Lucky]
Advertising Programmes Business Solutions+GoogleAbout GoogleGoogle.com
? 2016 - Privacy - Terms