使用Jsoup库可以很方便地获取网页的HTML内容。以下是一个使用Jsoup库的示例代码:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import android.os.AsyncTask;
import android.util.Log;
public class HTMLContentFetcher extends AsyncTask {
private static final String TAG = "HTMLContentFetcher";
@Override
protected String doInBackground(String... urls) {
String htmlContent = "";
try {
// Connect to the url and get the HTML content
Document doc = Jsoup.connect(urls[0]).get();
htmlContent = doc.html();
} catch (Exception e) {
Log.e(TAG, "Error fetching HTML content", e);
}
return htmlContent;
}
@Override
protected void onPostExecute(String htmlContent) {
// Process the HTML content here
// For example, you can parse the HTML using Jsoup selectors
Document doc = Jsoup.parse(htmlContent);
Elements links = doc.select("a[href]");
for (Element link : links) {
String href = link.attr("href");
String text = link.text();
Log.d(TAG, "Link: " + text + ", URL: " + href);
}
}
}
在调用时,你可以使用以下代码:
String url = "https://example.com";
HTMLContentFetcher fetcher = new HTMLContentFetcher();
fetcher.execute(url);
这将会在后台获取网页的HTML内容,并在onPostExecute
方法中处理该内容。你可以根据自己的需求对HTML进行进一步的处理。请注意,这是在后台线程中进行的,因此你不能在其中更新UI。如果需要更新UI,请在onPostExecute
方法中进行。