Windows API
Windows应用程序接口(Windows API),或俗称的WinAPI,是微软Windows操作系统中的一套核心应用程序接口。Windows API这一叫法实际上是多个Windows平台上相似接口的统称,这些接��也拥有各自的名字,如Win32 API。几乎所有的Windows应用程序都在与 Windows API 进行交互。
Windows API将与Windows系统有关的复杂操作封装在简单的函数当中,编译成动态链接库,再随Windows一同发布。开发者可以简单地借助这些函数来完成复杂的操作,有效降低了编写Windows程序的难度。
Windows有一个软件开发套件(SDK, software development kit)提供相应的文档和工具,以使程序员开发使用Windows API的软件和利用Windows技术。
C是Windows API(Win32)的主要编程语言[1],在该API的文档中所公开的函数和数据结构均以该语言进行了描述。但是,如果某种编程语言能够处理(明确定义的)低级数据结构,并能按照规定进行调用与回调,那么其编译器或汇编器也可以调用Windows API。类似地,在历史上Windows API也由多种语言进行了开发。[2]尽管C不是面向对象的编程语言,但Windows API和Windows都具有面向对象的特性;同时,也有许多面向对象语言的包装类和扩展(如微软基础类库MFC、可视化组件库VCL、GDI+等)使这种面向对象的结构更加清晰。例如,Windows 8提供的Windows API和WinRT API就是用C++[3]实现的,并且在设计上也是面向对象的[3]。
概述
编辑Windows API所提供的功能可以归为八类:[4]
提供了对Windows系统可用的基础资源的访问接口,包括文件系统(file system)、外部设备(device)、进程(process)、线程(thread)和错误处理(error handling)等。这些功能接口在16位Windows中位于kernel.exe、krnl286.exe或krnl386.exe中;在32位和64位Windows下位于kernel32.dll和KernelBase.dll中。这些文件在所有Windows的\Windows\System32 目录中都可以被找到。
高级服务(Advanced Services)
编辑提供了对内核以外功能的访问,包括注册表(Windows registry)、关闭/重启系统(shutdown/restart)、服务(Windows Service)、用户账户(user accounts)等。这些函数位于32位Windows上的advapi32.dll和advapires32.dll中。
提供了将图形内容输出到显示器、打印机和其他外部输出设备的功能。它位于16位Windows下的gdi.exe,以及32位Windows下的gdi32.dll中。
提供了创建和管理窗口和大多数基本控件(control)、接收鼠标和键盘输入,以及其他与GUI有关的功能。这些调用接口位于:16位Windows下的user.exe,以及32位Windows下的user32.dll。从Windows XP版本之后,基本控件和通用对话框控件(Common Control Library)的调用接口放在comctl32.dll中。
为应用程序提供标准对话框(如打开/保存文件对话框、颜色对话框和字体对话框等)。这个链接库位于:16位Windows下的commdlg.dll中,以及32位Windows下的comdlg32.dll中。它被归类为User Interface API之下。
为应用程序提供接口来访问操作系统提供的一些高级控件。比如像:状态栏(status bar)、进度条(progress bars)、工具栏(toolbar)和标签(tab)。这个链接库位于:16位Windows下的commctrl.dll中,以及32位Windows下comctl32.dll中。它被归类为User Interface API之下。使用API函数InitCommonControls或InitCommonControlsEx初始化(即注册)相应的窗口类。InitCommonControlsEx实际注册指定的通用控件的窗口类。注意ICC_WIN95_CLASSES代表12个控件类的集合。InitCommonControls是个空函数,但会使应用程序加载comctl32.dll;在comctl32.dll加载到进程时会在DLL的入口点调用InitCommonControlsEx注册ICC_WIN95_CLASSES控件类。
作为Windows API的组成部分,不仅允许应用程序访问Windows Shell提供的功能,还对之有所改进和增强。它位于16位Windows下的shell.dll中,以及32位Windows下的shell32.dll中(Windows 95则在shlwapi.dll中)。它被归类为User Interface API之下。
为访问操作系统提供的多种网络功能提供接口。它包括NetBIOS、Winsock、NetDDE及遠程過程調用(RPC)等。
Web相关API
编辑Internet Explorer网页浏览器还公开了许多经常被应用程序调用的API,因此通常其也被视为是Windows API的一部分。IE从Windows 95 OSR2起就包含在了Windows系统中,并从Windows 98起开始为应用程序提供Web相关服务[13]。具体来说,它提供:
- 可嵌入的网页浏览器控件(以及 Trident / MSHTML 引擎),位于shdocvw.dll和mshtml.dll之中。
- urlmon.dll中的命名服务(URL moniters service),利用COM对象为应用程序提供解析URL服务。应用程序也可以为其他程序提供自己的URL处理程序。
- WinInet IE的网络层,支持HTTP和HTTPS等协议。
- 一个支持多种语言文本的链接库(mlang.dll)。
- DirectX Transforms,一组图像过滤组件。
- XML支持(MSXML组件)。
和Windows的邮件功能相关的API,例如地址本和邮件API,在Windows 7取消邮件功能之后也随之从Windows API中去除。由于Windows Mail在Windows Vista上取代了Outlook Express,对应的API也随之变化。
多媒体相关API
编辑经典的Windows多媒体API位于winmm.dll中,包含了播放音频、MIDI通讯、游戏手柄及其他促进多媒体体验的功能。该API源自Windows 3.x。
自从Windows 95 OSR2以来,Microsoft把DirectX API作为Windows安装的一部分。DirectX提供一组松散相关的多媒体和游戏服务,包括:
- Direct3D可以作为OpenGL的替代,来访问3D加速硬件。
- DirectDraw提供硬件加速2D framebuffer(帧缓冲)访问接口。自DirectX 9以来,相比Direct3D更倾向于后者,因为Direct3D提供更全面的高性能图形功能(毕竟2D渲染只是3D渲染的(不严格)子集)。已被Direct2D替代。
- DirectSound提供底层次的硬件加速声卡访问。被XAudio替代。
- DirectInput用来与输入设备(搖桿和gamepad)进行通信。已被DirectX 9中引入的XInput所替代。
- DirectPlay提供一个多人游戏的架构(multiplayer gaming infrastructure)。它已经被DirectX 9所替代,Microsoft不建议用它开发游戏。
- DirectShow可以创建和运行通用的多媒体管道(generic multimedia pipelines)。它可以与GStreamer框架相媲美,并且经常被用来渲染游戏视频和创建媒体播放器(Windows Media Player及诸如FFDShow之类的编解码器正是基于此;但在Windows Vista及更高版本中,DirectShow被Media Foundation替代)。不建议用DirectShow开发游戏。
- DirectMusic提供类似MIDI的功能。与DirectSound一起被XAudio替代。
Microsoft还提供了多个用于媒体编码和播放的API:
- DirectShow,用于构建和运行通用的媒体管道。它类似于GStreamer框架,常用于渲染游戏内的视频和构建媒体播放器(著名的Windows Media Player即基于它)。如今DirectShow已不再被推荐用于开发。
- Media Foundation,一种较新的数字媒体API,旨在取代DirectShow。
程序通信API
编辑Windows API最重要功能即为此:处理操作系统和应用程序之间的交互。对于不同的Windows应用程序之间的通信,Microsoft发展了一系列的技术并开发了最主要的Windows API。这些技术从动态数据交换(DDE)开始,随后被对象链接和嵌入(OLE)取代,再被组件对象模型(COM)、自动化对象、ActiveX控件和.NET框架取代。不过,这些技术之间区别并不总是十分明显,并且有很多重叠之处。
这些技术的多样性基本上是对软件开发的不同方面进行细分的结果。自动化特别涉及了导出应用程序和组件的功能为API,以便使其可以由其他应用程序而不是人类来进行控制。.NET是一种自包含的通用方法和技术,用于开发各种使用即时编译语言编写的桌面和Web应用程序。
Windows.pas是一个Pascal/Delphi单元,其中包含了Windows特定的API声明。它在Pascal中的作用就像C中的windows.h一样。
封装库
编辑微軟利用许多更底层的Windows API函数,开发出许多封装库(wrapper),让应用程序以更抽象的方式与Windows API进行交互。MFC(Microsoft Foundation Class Library)用C++ 類来封装Windows API的功能,因而允许用更為物件導向的方式与API进行交互。ATL(Active Template Library)是对COM的面向模板(template oriented)的封装。WTL(Windows Template Library)作为ATL的增强,被用来作为MFC的轻型的替代物。
其他著名的封装库是Borland公司的产品,为了与MFC竞争而推出的OWL(Object Windows Library)提供了类似的物件導向封装。不久Borland又推出VCL(Visual Component Library)来取而代之。
大多數的Windows 程序框架(application framework)是对Windows API的封装,因而.NET Framework、Java以及其他在Windows下的程序语言,都是(或者包含)封装库。
歷史
编辑Windows API總會為程式設計師提供大量的構建不同 Windows的底層結構,這有助於為 Windows 程式設計師開發應用程序提供大量的靈活性和功能。但是,它同樣使Windows应用程式要負責處理大量底層且有時是繁瑣的與图形用户界面(GUI)相關的操作。
例如,初学C的程序员通常会把编写简单的“Hello world”作为他们的第一项任务。程序的工作部分仅仅是主程序中的一个printf行,在链接到标准I/O库时也仅需要一个include行:
#include <stdio.h>
int main(void) {
printf("Hello, World!\n");
}
Windows版本的工作部分仍然只有一行代码,但除此之外它需要很多很多行的额外开销。
許多有關Windows API的暢銷書的作者查尔斯·佩佐德(Charles Petzold)曾經說過:[14]
“ | Windows 1.0 SDK中的最初的Hello world程式或多或少沾了些丑闻。HELLO.C大约有150行,而HELLO.RC资源脚本还多加了大约20多行……在接触到Windows 的Hello world程式时,资深的C程式员通常会惊恐或大笑起来。 | ” |
——查尔斯·佩佐德(Charles Petzold),Programming Microsoft Windows with C# |
這些年來,Windows作業系統已經今非昔比,而Windows API也隨之改變和成長並反映出這種變化。Windows API的Windows 1.0版本只提供不到450個函數調用(Subroutine),而現在的版本提供上千個。然而,整體而言,Windows接口保持了相當好的一致性,習慣於現在版本Windows API的程式設計師對古老的Windows 1.0程序也並不会陌生。[15]
微软特别強調維持軟件的向後兼容性。為了實現此一目標,有時微軟甚至不惜支持使用了非官方乃至(編程上)非法的API的軟件。一位致力於Windows API的Windows開發者雷蒙德·陈(Raymond Chen)曾提及:[16]
“ | 仅仅是关于应用程序所做出的坏事以及我们让应用程序重新运作所必须(通常是在不由自主的情况下)采用的方法,我可能会写上几个月。这就是在人们指责微软在操作系统升级期间恶意破坏应用程序时,我会特别愤怒的原因。如果有任何无法在Windows95上运行的应用程序,我会将这些应用程序视为个人故障。 | ” |
——Raymond Chen,What about BOZOSLIVEHERE and TABTHETEXTOUTFORWIMPS? |
对Windows API来说,其历史上最大的变化之一就是从Win16(在Windows 3.1及更早的版本中提供)到Win32(Windows NT和Windows 95及更高版本)的过渡。虽然Win32早已在Windows NT 3.1中引入,并在Windows 95前就已允许使用,但直到Windows 95应用程序才开始广泛移植到Win32。为了简化转换的过程,在Windows 95中对Microsoft内外的开发人员Windows使用了一种复杂的API thunk方案来允许32位代码调用到16位代码(对大多数Win16 API有效),反之亦然。同样的,64位的Windows也可以通过WoW64运行32位的应用程序,而位于Windows目录下的SysWOW64文件夹中包含了多个用于支持32位应用程序的工具。
版本
编辑几乎每个版本的Windows都引入了其对Windows API的添加和修改[17],但是API的名称在不同版本的Windows间保持了一致,并且仅当Windows主要的架构和平台都更改时API的名称才会改变。Microsoft最终将当时名叫Win32的API家族改名为Windows API,并使其成为过去和未来API版本的统称。
- Win16是第一个16位版本Windows的API。它最早被简单地叫做Windows API,但后来为了与较新的32位API区分,它被重新命名为了Win16。Win16 API的功能主要驻留在操作系统的核心文件中,如kernel.exe(或krnl286.exe、krnl386.exe)、user.exe和gdi.exe。值得一提的是,尽管这些文件采用了exe的扩展名,它们本质上其实是动态链接库。
- Win32是Windows 95及后续版本的32位API。与Win16相同,这个API由在系统DLL中实现的函数组成。Win32的核心文件是kernel32.dll、user32.dll和gdi32.dll。Win32最早在Windows NT中引入,而不是Windows 95。Windows 95中的Win32最早被称为Win32c,其中的“c”表示兼容性(英语:compatibility);这个名称后来被微软舍弃,转而使用Win32。
- Win32s是Windows 3.1x系列的扩展,它为这些系统实现了Win32 API的一部分功能。其中的“s”表示子集(英语:subset)。
- Win64是64位Windows上的Windows API变体。此时应用程序的32位和64位版本可以从同一个代码库进行编译。在默认情况下,所有内存指针都是64位的(LLP64型),因此部分程序的源代码必须被重写以兼容64位指针算法。
- WinCE是Windows CE操作系统中的Windows API。
其它实现
编辑尽管微软的Windows API实现有版权保护,但被普遍认可的是,根据美国的法律先例,其他厂商仍然可以通过提供一致的API来模拟Windows,而不会侵犯版权。
Wine项目为类Unix平台提供了一个在Linux内核API与Windows API程序之间的Win32 API兼容层。ReactOS则更进一步,想要实现一个完整的Windows操作系统;它通过与Wine项目的密切合作来促进其代码的重用和兼容。DosWin32和HX DOS-Extender是另外两个模拟Windows API的项目,它们允许通过DOS命令行来运行简单的Windows程序。Odin是一个在OS/2平台上模拟Win32的项目。
编译器支持
编辑为了开发使用Windows API的软件,编译器必须能处理和导入微软相关的DLLs或者COM对象。编译器必须接受一种C或C++方言,或者能够处理揭示了内部API函数名称的接口定义语言(Interface description language)文件和头文件及生成的类型库(Type Library)。概括而言,这些预备条件(编译器、开发工具、库和头文件)被统称为Microsoft Platform SDK。很长时间以来,包含了编译器和开发工具的专利产品如Microsoft Visual Studio系列和Borland编译器(尽管至少在Windows下,SDK是可以从整个IDE环境中剥离出来单独免费下载的,据Microsoft Platform SDK Update),是仅有的能提供整套开发环境的选择。如今MinGW和Cygwin也能提供一套这样的开发环境——是基于采用一种独立头文件集合来保证能与微软DLL连接的GCC。LCC-Win32是由Jacob Navia维护的一种“非商业用途免费”的C编译器。Pellesc是由Pelle Orinius维护的一种免费C编译器。MASM32是一个成熟的项目,它通过自制或由SDK平台转换的头文件和库,并利用32位微软汇编器来实现支持Windows API。
微软相关的编译器支持也是异常处理(Structured Exception Handling)特性所需要的。这个体制有双重目的:它提供了语言相关的异常处理赖以实现的基础,同时也是内核藉以通知程序发生诸如解除一个非法指针的引用或堆栈溢出之类异常状况的渠道。甫一被引入Windows 95和NT,微软/Borland C++编译器就有使用这种体制的能力,然而实际实现未被公开,而且必须经过反向工程方可用于Wine项目和免费编译器。SEH的运行机制是先把异常的句柄推入堆栈,继而将它们添加到存储于线程本地资源(即线程环境块的首字段)的一个链表里。事实上,每一个未有程序本身处理的异常,都将由会弹出常规Windows崩溃对话框的默认backstop处理器处理。
API在Visual Basic中的实现示例(这个简化的例子使得用户可以让命令按钮在窗体上四处移动):
Private Const WM_NCLBUTTONDOWN As Long = &HA1&
Private Const HTCAPTION As Long = 2&
Private Declare Function ReleaseCapture Lib "user32" () As Long
Private Declare Function SendMessage Lib "user32" Alias "SendMessageA" (ByVal hWnd&, ByVal wMsg&, wParam As Any, lParam As Any) As Long
If Command1.MousePointer = 14 Then
Call ReleaseCapture
Call SendMessage(Command1.hWnd, WM_NCLBUTTONDOWN, ByVal HTCAPTION, ByVal 0&)
End If
注释
编辑- ^ Walkthrough: Creating Windows Desktop Applications (C++). docs.microsoft.com. [2021-10-12]. (原始内容存档于2022-04-23) (美国英语).
- ^ 在C成为主流语言之前,Windows API中使用了大量的Pascal和x86汇编语言。对此一个遗留的痕迹就是API函数中仍然使用了Pascal的方式来处理调用函数时传递的参数(而不是像C的那样)。
- ^ 3.0 3.1 Mayberry, Michael. WinRT Revealed. New York City: Apress. 2012: 3. ISBN 978-1-4302-4585-8.
- ^ Microsoft Developer Network(July 2005). Overview of the Windows API. (页面存档备份,存于互联网档案馆) Retrieved August 28, 2005.
- ^ Microsoft Developer Network(July 2005). Base Services.[永久失效連結] Retrieved August 28, 2005.
- ^ Microsoft Developer Network(July 2005). Graphics Device Interface.[永久失效連結] Retrieved August 28, 2005.
- ^ Microsoft Developer Network(July 2005). User Interface.[永久失效連結] Retrieved August 28, 2005.
- ^ Microsoft Developer Network(2005). Common Dialog Box Library.[永久失效連結] Retrieved September 22, 2005.
- ^ Microsoft Developer Network(July 2005). Common Control Library.[永久失效連結] Retrieved August 28, 2005.
- ^ Microsoft Developer Network(July 2005). Windows Shell.[永久失效連結] Retrieved August 28, 2005.
- ^ Microsoft Developer Network(2005). Shell Programmer's Guide.[永久失效連結] Retrieved August 28, 2005.
- ^ Microsoft Developer Network(July 2005). Network Services. Retrieved August 28, 2005.
- ^ Microsoft Developer Network(January 2006). Programming and reusing the browser (页面存档备份,存于互联网档案馆) Retrieved January 22, 2006.
- ^ Charles Petzold (December 2001). Programming Microsoft Windows with C#. Microsoft Press. Beyond the Console, page 47.
- ^ Charles Petzold(November 11, 1998). Programming Windows, Fifth Edition. Microsoft Press. APIs and Memory Models, page 9.
- ^ Raymond Chen(October 15, 2003). What about BOZOSLIVEHERE and TABTHETEXTOUTFORWIMPS? (页面存档备份,存于互联网档案馆) Retrieved August 27, 2005.
- ^ History of the Windows API. web.archive.org. 2002-08-02 [2021-10-12]. 原始内容存档于2002-08-02.
参考资料
编辑- Diomidis Spinellis。A critique of the Windows application programming interface (页面存档备份,存于互联网档案馆). Computer Standards & Interfaces, 20(1):1–8, November 1998. doi:10.1016/S0920-5489(98)00012-9。
外部链接
编辑- Microsoft Developer Network Windows API development guide (页面存档备份,存于互联网档案馆)
- The Old New Thing (页面存档备份,存于互联网档案馆) Weblog by Microsoft developer Raymond Chen,who works on the Windows API and posts extensively about it.
- Localization in Win32 (页面存档备份,存于互联网档案馆)
- pinvoke.net: the interop wiki! (页面存档备份,存于互联网档案馆) PINVOKE.NET attempts to address the difficulty of calling Win32 or other unmanaged APIs in managed code (languages such as C# and VB .NET).
- Windows API Notes
- WinapiZone (页面存档备份,存于互联网档案馆) Free tutorials and extensions for Winapi
- Stromcode's Win32/C++ tutorial (页面存档备份,存于互联网档案馆) (formerly Glowdot) an extensive, 20-part tutorial.
- Catch22 Tutorials Well documented Win32 API tutorials for developing small, nifty, and efficient programs in Windows.
- theForger's Win32 API Tutorial
- Using Win32 API in Visual FoxPro (页面存档备份,存于互联网档案馆) online reference