Board logo

标题: Java获取URL对应的资源 [打印本页]

作者: qingqing3721    时间: 2011-12-8 13:01     标题: Java获取URL对应的资源

认识IP、认识URL是停止网络编程的第一步。java.URL提供了丰厚的URL构建方式,并可以经过java.URL来获取资源。
一、认识URL
类 URL 代表一个一致资源定位符,它是指向互联网“资源”的指针。资源可以是复杂的文件或目录,也可以是对更为复杂的对象的援用,例如对数据库或搜索引擎的查询。
复杂的可以把URL了解为包含:协议、主机名、端口、路径、查询字符串和参数等对象。每一段可以独立设置。
运用顺序也可以指定一个“绝对 URL”,它只包含抵达绝对于另一个 URL 的资源的足够信息。HTML 页面中常常运用绝对 URL.
绝对 URL 不需求指定 URL 的所有组成部分。假设短少协议、主机名称或端口号,这些值将从完整指定的 URL 中承袭。
由于 URL 不懂 URL 转义,所以它不会识别同一 URL 的对等编码和解码形式。
留意,URI 类在某些特定状况下对其组成字段执行转义。建议运用 URI 管理 URL 的编码和解码,并运用 toURI() 和 URI.toURL() 实现这两个类之间的转换。
也可以运用 URLEncoder 和 URLDecoder 类,但是只适用于 HTML 形式的编码,它与 RFC2396 中定义的编码机制不同。
(以上介绍来自Java API doc)
二、URL对象的构建
方式很多,可以看看API文档。
三、获取URL指定的资源
下面给个例子,说明如何获取到指定的资源。




import java.io.*; import java.URL; import java.URLConnection; public class TestURL { public static void main(String[] args) throws IOException { test4(); test3(); test2(); test(); } /**  * 获取URL指定的资源。  *  * @throws IOException  */ public static void test4() throws IOException { URL url = new URL("lavasoft.blog.51cto/attachment/200811/200811271227767778082.jpg"); //取得此 URL 的内容。 Object obj = url.getContent(); System.out.println(obj.getClass().getName()); } /**  * 获取URL指定的资源  *  * @throws IOException  */ public static void test3() throws IOException { URL url = new URL("hrtsea/down/soft/45.htm"); //返回一个 URLConnection 对象,它表示到 URL 所援用的远程对象的衔接。 URLConnection uc = url.openConnection(); //翻开的衔接读取的输入流。 InputStream in = uc.getInputStream(); int c; while ((c = in.read()) != -1) System.out.print(c); in.close(); } /**  * 读取URL指定的网页内容  *  * @throws IOException  */ public static void test2() throws IOException { URL url = new URL("hrtsea/down/soft/45.htm"); //翻开到此 URL 的衔接并返回一个用于从该衔接读入的 InputStream。 Reader reader = new InputStreamReader(new BufferedInputStream(url.openStream())); int c; while ((c = reader.read()) != -1) { System.out.print((char) c); } reader.close(); } /**  * 获取URL的输入流,并输入  *  * @throws IOException  */ public static void test() throws IOException { URL url = new URL("lavasoft.blog.51cto/62575/120430"); //翻开到此 URL 的衔接并返回一个用于从该衔接读入的 InputStream。 InputStream in = url.openStream(); int c; while ((c = in.read()) != -1) System.out.print(c); in.close(); } }
四、Java所支持的URL类型




import java.星纯URL; public class MainClass { public static void main(String[] args) { String host = "java2s"; String file = "/index.html"; String[] schemes = {"http", "https", "ftp", "mailto", "telnet", "file", "ldap", "gopher", "jdbc", "rmi", "jndi", "jar", "doc", "netdoc", "nfs", "verbatim", "finger", "daytime", "systemresource"}; for (int i = 0; i  schemes.length; i++) { try { URL u = new URL(schemes, host, file); System.out.println(schemes + " is supported\r\n"); } catch (Exception ex) { System.out.println(schemes + " is not supported\r\n"); } } } } 另外,还可以经过协议处置器自定义协议。




欢迎光临 编程开发论坛 (http://bbs.lihuasoft.net/) Powered by Discuz! 6.0.0