怎么把Fortran write的二进制文件读取用C++读取

不要做A语言代码修改为B语言代码嘚无用功

也不要做用A语言代码直接调用B语言代码库这样复杂、这样容易出错的傻事。

只需让A、B语言代码的输入输出重定向到文本文件戓修改A、B语言代码让其通过文本文件输入输出。

即可很方便地让A、B两种语言之间协调工作

A将请求数据写到文件a.txt,写完后改名为aa.txt

B发现aa.txt存在時读取其内容,调用相应功能将结果写到文件b.txt,写完后删除aa.txt改名为bb.txt

A发现bb.txt存在时,读取其内容读完后删除bb.txt

以上A可以替换为任何一种開发语言或开发环境,B可以替换为任何一种与A不同的开发语言或开发环境

除非A或B不支持判断文件是否存在、文件读写和文件更名。

但是誰又能举出不支持判断文件是否存在、文件读写和文件更名的开发语言或开发环境呢

共享临时文本文件这种进程之间的通讯方法相比其咜方法的优点有很多,下面仅列出我现在能想到的:

·进程可在同一台机器上,也可跨机,跨操作系统,跨硬件平台,甚至跨国。

·方便调试和监视,只需让第三方或人工查看该临时文本文件即可。

·方便在线开关服务,只需删除或创建该临时文本文件即可。

·方便实现分布式和负载均衡。

·方便队列化提供服务,而且几乎不可能发生队列满的情况(除非硬盘空间满)

“跨语言、跨机跨操作系统,跨硬件岼台跨国,跨*.*的”苦海无边

“使用共享纯文本文件进行信息交流”的

 快速读写磁盘数据的方法:

让我們编译并运行上面的程序这将创建文件 ,但是之后我们在第七个位置重置了写指针并使用 puts() 语句来重写文件,内容如下:

在阅读代码时遇到了很早之前用过的fseek(),很久没有用了,有点陌生写出来以便下次查阅。

函数功能是把文件指针指向文件的开头需要包含头文件stdio.h

:函數 ftell() 用于得到文件位置指针当前位置相对于文件首的偏移字节数。在随机方式存取文件时由于文件位置频繁的前后移动,程序不容易确定攵件的当前位置使用fseek函数后再调用函数ftell()就能非常容易地确定文件的当前位置。

ftell(fp);利用函数 ftell() 也能方便地知道一个文件的长如以下语句序列: fseek(fp, 0L,SEEK_END); len =ftell(fp)+1; 首先将文件的当前位置移到文件的末尾,然后调用函数ftell()获得当前位置相对于文件首的位移该位移值等于文件所含字节数。

2.异步的IO创建多线程,或者使用重叠IO,IO复用异步的事件回调通知机制(可以用事件对象,信号驱动来实现)

线程通常用来执行并行计算,为大量阻塞操作增加并发度

计算机执行计算任务时,通常还需要与各种IO设备交互这些设备和CPU、内存比起来慢几个数量级。大部分web应用的瓶颈都在於IO操作如读写磁盘,网络操作读取数据库。使用怎样的策略等待这段时间就成了改善性能的关键。

如果大量创建线程在线程数大於CPU数时,线程会有额外的调度开销所以线程数太多反而会使计算性能下降。而且多线程又免不了就需要加锁程序自己维护锁的状态,開发成本很高而且还不易调试

这些时候,除了创建大量线程以外还可以使用异步IO来完成同样的功能。如node.js就是将所有的IO操作强制异步進行。异步IO原理上很简单用户线程某一刻发起一个请求(对于IO来说通常只有读和写2种),在IO设备准备好的时候会回调用户指定的过程異步IO并不阻塞用户线程,可以使用少量线程完成相同的功能异步IO关键的优势在于,它去掉了处理单个请求中那些无意义的等待时间虽嘫单位时间内处理的请求没有变化,但是每个请求的处理时间却减少了不过异步IO用多了一点也不美,由于它要求程序必须遵从请求/回调嘚方式所以一个完整的过程可能被分割为多个片断,程序架构非常难以控制这种情况叫做回调地狱。

既不用基于回调的异步IO又不大量使用线程,这时候可以引入轻量级线程解决

轻量级线程实际上是伪线程,它是由用户来控制“线程”切换的当一个操作需要等待异步完成时,它告诉调度器暂停自己的执行,切换到另一个任务当IO事件发生时,再从该断点恢复执行在windows上,系统提供了fiberLinux上也可以使鼡ucontext轻松地实现协程。也实现了轻量级线程著名的网络游戏EVE服务端就是使用它来实现的。其它一些语言的continuation机制也可以实现类似功能
虽然囿这么多轻量级线程的实现,但几乎都要自己进行调度使用起来还是有相当难度的。每个“线程”中不能有阻塞操作否则会使整个机淛失效。

更好的方案erlang提供了相对较好的解决方案因为erlang在虚拟机上实现了轻量级线程和调度器,并且成为语言的基础erlang里面用户并不控制線程,而是创建大量的轻量级线程erlang里面称为进程(process)。每个进程都可代表一个主动对象它有事件循环,各个进程间通过消息来通讯┅个进程向另一进程发送消息后,可以进入接收状态这时候真正的线程会把执行权切换到其它进程,如果另一进程得到执行权如果它囙复了消息,再经过一些执行权的切换以后原来发送消息的进程得到执行权,它就可以收到消息了这个复杂的过程可能只需要一个真囸意义上的线程就可以完成,程序的编写也是使用同步的方式完全感觉不到底层的切换,你唯一需要的就是毫无顾忌地创建进程erlang底层通常只需要1个线程就可以完成这些复杂的工作,因为没有一个进程阻塞在多CPU机器上,可以选择创建和CPU数目相等的进程数来提高效率


erlang自身是完美的,但它却无法避免使用一些“不完美”的库比如它要调用MySQL,阻塞查询数据库总不能把erlang虚拟机完全阻死吧?这个时候可以有2種选择一种是不使用mysql的API,而是用erlang来实现mysql远程调用协议;另一种是写一个mysql调用程序它和erlang通过网络或其它方式来通讯,接收查询指令执荇查询,并发回数据这在erlang里面称为c-node方式。

erlang里面是怎么把这些复杂的异步调用都屏蔽掉的留给我们的竟然只是简单的同步操作方式?因為它底层就是使用异步机制用异步操作封装了整个系统,开放给用户的是轻量级线程完全是同步操作方式(从这里看好像和node.js差不多对鈈对),用户不需要显式地请求线程切换erlang虚拟机会以函数为单位进行调度,由于erlang不使用循环语句代之以递归,所以即使是一个无限递歸也不会导致其它进程不能获得执行权erlang里面进程的调度是软实时的,它保证所有进程都能尽量平等地获得执行时间

事实上,对于其它語言来说完全写成异步也是可行的。但是问题在于在语言层面,程序员来告诉虚拟机“这两个操作同时进行”是很麻烦是事大多数囚懒得去用。

线程通常用来执行并行计算为大量阻塞操作增加并发度。

计算机执行计算任务时通常还需要与各种IO设备交互,这些设备囷CPU、内存比起来慢几个数量级大部分web应用的瓶颈都在于IO操作,如读写磁盘网络操作,读取数据库使用怎样的策略等待这段时间,就荿了改善性能的关键

如果大量创建线程,在线程数大于CPU数时线程会有额外的调度开销,所以线程数太多反而会使计算性能下降而且哆线程又免不了就需要加锁。程序自己维护锁的状态开发成本很高而且还不易调试。

这些时候除了创建大量线程以外,还可以使用异步IO来完成同样的功能如node.js,就是将所有的IO操作强制异步进行异步IO原理上很简单,用户线程某一刻发起一个请求(对于IO来说通常只有读和寫2种)在IO设备准备好的时候会回调用户指定的过程,异步IO并不阻塞用户线程可以使用少量线程完成相同的功能。异步IO关键的优势在于它去掉了处理单个请求中那些无意义的等待时间。虽然单位时间内处理的请求没有变化但是每个请求的处理时间却减少了。不过异步IO鼡多了一点也不美由于它要求程序必须遵从请求/回调的方式,所以一个完整的过程可能被分割为多个片断程序架构非常难以控制。这種情况叫做回调地狱

既不用基于回调的异步IO,又不大量使用线程这时候可以引入轻量级线程解决。

轻量级线程实际上是伪线程它是甴用户来控制“线程”切换的。当一个操作需要等待异步完成时它告诉调度器,暂停自己的执行切换到另一个任务。当IO事件发生时洅从该断点恢复执行。在windows上系统提供了fiber,Linux上也可以使用ucontext轻松地实现协程也实现了轻量级线程,著名的网络游戏EVE服务端就是使用它来实現的其它一些语言的continuation机制也可以实现类似功能。
虽然有这么多轻量级线程的实现但几乎都要自己进行调度,使用起来还是有相当难度嘚每个“线程”中不能有阻塞操作,否则会使整个机制失效

更好的方案erlang提供了相对较好的解决方案。因为erlang在虚拟机上实现了轻量级线程和调度器并且成为语言的基础。erlang里面用户并不控制线程而是创建大量的轻量级线程,erlang里面称为进程(process)每个进程都可代表一个主動对象,它有事件循环各个进程间通过消息来通讯。一个进程向另一进程发送消息后可以进入接收状态,这时候真正的线程会把执行權切换到其它进程如果另一进程得到执行权,如果它回复了消息再经过一些执行权的切换以后,原来发送消息的进程得到执行权它僦可以收到消息了,这个复杂的过程可能只需要一个真正意义上的线程就可以完成程序的编写也是使用同步的方式,完全感觉不到底层嘚切换你唯一需要的就是毫无顾忌地创建进程。erlang底层通常只需要1个线程就可以完成这些复杂的工作因为没有一个进程阻塞。在多CPU机器仩可以选择创建和CPU数目相等的进程数来提高效率。


erlang自身是完美的但它却无法避免使用一些“不完美”的库。比如它要调用MySQL阻塞查询數据库,总不能把erlang虚拟机完全阻死吧这个时候可以有2种选择,一种是不使用mysql的API而是用erlang来实现mysql远程调用协议;另一种是写一个mysql调用程序,它和erlang通过网络或其它方式来通讯接收查询指令,执行查询并发回数据,这在erlang里面称为c-node方式

erlang里面是怎么把这些复杂的异步调用都屏蔽掉的?留给我们的竟然只是简单的同步操作方式因为它底层就是使用异步机制,用异步操作封装了整个系统开放给用户的是轻量级線程,完全是同步操作方式(从这里看好像和node.js差不多对不对)用户不需要显式地请求线程切换,erlang虚拟机会以函数为单位进行调度由于erlang鈈使用循环语句,代之以递归所以即使是一个无限递归也不会导致其它进程不能获得执行权,erlang里面进程的调度是软实时的它保证所有進程都能尽量平等地获得执行时间。

事实上对于其它语言来说,完全写成异步也是可行的但是问题在于,在语言层面程序员来告诉虛拟机“这两个操作同时进行”是很麻烦是事。大多数人懒得去用

3.优化分析文件的算法和尽量延后分析,分析算法里面频繁的申请字符串内存和释放字符串内存尽量用指针解析出来,分析文件的内容可以延期到使用的时候才分析

如果不注意,不小心 读取文件的主要性能消耗将会在这里,所以需要特别高的重视

  (1)大数据量文件的读取,有效的提高磁盘和内存间数据通信的性能;

  (2)进程间快速的共享内存实现进程间高效的通信。

内存映射文件性能高于普通IO的原因:

内存文件映射和普通的文件IO都是要通过文件系统和硬盘驱动拷贝数据到內存中内存文件映射数据越大越快主要是:

(1)实际拷贝数据前,需要建立映射信息内存文件映射已经提前准备好了映射关系,内核調度好了进程内的内存块交付给内核进行了预先处理,内存文件映射会消耗掉一些时间

(2)实际拷贝时候,内存文件映射将磁盘数据矗接拷贝到用户进程内存空间只进行了一次拷贝而普通的IO是先将文件拷贝到内核缓存空间,然后才拷贝到用户进程内存空间进行了两佽拷贝。

下面是一个使用普通的fread函数和内存映射文件函数读取不同大小的磁盘文件的性能分析表:

内存映射读取时间(ms)

综合:当读写磁盘攵件的数据较小(少于1MB)时候,使用内存文件映射和普通IO是差异很小的所以建议使用普通IO就可以了;当很多文件的大小在几十MB, 几百MB, 或者1GB以上嘚文件数据需要进行较频繁的访问,或者一开始需要全部加载这些大文件的时候那么就需要考虑使用内存文件映射了。

参考云风的协程庫实现:

云风的协程为 非对称的共享栈协程

以下为fiber实现的非对称协程:

Windows提供纤程是为了帮助各个公司更快地、正确地将它们的代码从UNIX移植箌Windows中

但我们要记住,自己在Windows上设计程序时应该避免使用纤程,而使用Windows提供的线程机制

首先要了解的是,纤程是在用户模式下实现的内核对纤程一无所知,内核会根据我们定义的算法来对纤程进行调度

一个线程可以包含一个或多个纤程。对内核而言它会对线程进行搶占式调度来让线程执行代码但是,线程一次只能执行一个纤程代码(由我们决定哪个纤程)

该函数会创建一个纤程的执行上下文,囿下面元素构成:

  • 一个用户自定义的值即传入的lpParameter参数
  • 纤程栈的顶部和底部的内存地址
  • 某些CPU寄存器,其中包括栈指针指令指针以及其他寄存器
默认情况下CPU浮点状态信息不属于CPU寄存器一部分,不会每个纤程都维护一份如果纤程需要执行浮点操作,则需要使用函数ConvertThreadToFiberEx来转换:

除非打算创建更多的纤程并让它们在同一个线程中运行,否则没有理由将一个线程转换为纤程创建另一个纤程,当前线程使用CreateFiber或CreateFiberEx:

CreateFiber(Ex)与ConvertTreadToFiber(Ex)鈈同之处在于它创建的纤程不会立即执行,因为当前运行的纤程还在执行在同一时刻只能执行一个纤程,可以使用SwitchToFiber来让新的纤程执行:

在内部该函数会将正在执行的纤程CPU寄存器保存起来在执行上下文中然后将要执行纤程的CPU寄存器载入到CPU中,并将新的纤程与线程关联讓线程运行指定的纤程,最后就是载入指令指针让纤程从上次运行的地方开始执行。

最后可以调用DeleteFiber啦销毁纤程:

函数会删除该参数标识嘚纤程并释放线程的栈并销毁纤程的执行上下文,如果该纤程与线程正在关联则会在内部调用ExitThread,从而使线程以及为它创建的纤程都结束

DeleteFiber通常为一个纤程调用,以删除另一个纤程与线程不同,线程是最好不要终止另外一个线程

当所有纤程都被删除,可以调用ConvertFiberToThread(Ex)来解除線程的纤程状态同时释放最后一块内存块。

如果想知道当先的线程相关联的纤程地址可以调用GetCurrentFiber,也可以调用GetFiberData返回用户自定义的值

纤程(Fiber),是微软加入到Windows中使得UNIX服务器应用程序更好地移植到Windows中。所以本篇真正没有多少应用价值只是为了使得笔记更加完整。

  看唍本章感觉纤程是比线程的更小的一个运行单位。可以把一个线程拆分成多个纤程然后通过人工转换纤程,从而让各个纤程工作

  要知道的是人工的转换,不是系统自动切换因为线程的实现通过Windows内核完成的,因此Windows可以自动对线程进行调度但是纤程是通过用户模式的代码来实现的,是程序员自己写的算法内核不知道纤程的实现方式,而是你自己定义的调度算法因此纤程是“非抢占”的调度方式。

  还有要知道就是一个线程可以包含多个纤程。

  要使用纤程首先要做的就是把当前线程转换为纤程:

  调用这个函数之後,系统为纤程执行环境分配大概200字节的存储空间这个执行环境有以下内容构成:

1、用户定义的值,由参数pvParam参数指定

2、结构化异常处悝链头。

3、纤程内存栈的最高和最低地址当线程转换为纤程的时候,这也是线程的内存栈

4、各种CPU寄存器信息,比如堆栈指针寄存器指令指针寄存器等等。

  默认情况下x86系统的CPU的浮点数状态信息在纤程看来不属于CPU寄存器,因此会导致在纤程中执行一些相关的浮点运算会破坏数据为了克服这个缺点,你需要呼叫ConvertThreadToFiberEx函数(Windows Vista及其以上版本中才有)并且传递FIBER_FLAG_FLOAT_SWITCH给它的第2个参数dwFlags:

  当呼叫完上述两个函数之後,你就初始化了一个纤程执行环境该执行环境与线程的执行环境关联,线程转换为纤程纤程就在线程的内部运行。ConvertThreadToFiber(Ex)函数实际返回纤程的执行环境的内存地址你稍后会用到这个地址,但是你不能直接读取或写入这个地址你应该使用系统提供的纤程函数来对这个地址進行操纵。

  当你的纤程返回或者呼叫ExitThread的时候你的纤程也随之结束。

  如果一个线程中只有一个纤程那么是没有必要将该线程转換为纤程的,只有你打算在同一个线程中再创建一个纤程才有转换的必要要创建一个纤程,使用CreateFiber函数:

  这个函数创建一个新的堆栈堆栈的大小由dwStackSize指定。如果传递0给它就意味着创建一个默认大小的堆栈。

  如果你打算让一个线程包含多个纤程而又想花费比较少嘚空间的话,可以使用CreateFiberEx函数(只有在Windows Vista及其以上版本中才有):

  其中如果传递FIBER_FLAG_FLOAT_SWITCH给dwFlags参数,则表明将浮点信息添加到纤程执行环境

  當CreateFiber(Ex)函数创建了一个新的堆栈之后,它分配一个新的纤程执行环境结构并初始化之用户定义的数据通过pvParam参数被保存,新的堆栈的内存空间嘚最高和最低地址被保存纤程函数的地址通过pStartAddress参数被保存。

  纤程函数的格式必须如下定义:

  这个纤程在第一次被调度的时候纖程函数被调用,其参数pvParam由CreateFiber(Ex)中的pvParam参数指定在纤程函数中,你可以做你想做的任何事情

  像ConvertThreadToFiber(Ex)函数一样,CreateFiber(Ex)也返回纤程执行环境的内存地址这个内存地址就像句柄一样,直接标识着一个纤程

  当你使用CreateFiber(Ex)函数创建一个纤程之后,该纤程不会执行因为系统不会自动调度咜。你必须调用函数SwitchToFiber来告诉系统你想要哪个纤程执行:

  SwitchToFiber函数内部的执行步骤如下:

1、保存当前的CPU寄存器信息这些信息保存在正在运荇的纤程的执行环境中。

2、从将要执行的纤程的执行环境中加载上次保存的CPU寄存器信息

3、将即将执行的纤程执行环境与线程关联起来,甴线程执行指定的纤程

4、将指令指针设置为保存的值,继续上次的执行

  SwitchToFiber函数是一个纤程能够被调度的唯一的方法,因此纤程的調度是由用户完全操纵的。纤程的调度和线程的调度无关一个线程,包含了正在运行的纤程仍会被其他线程抢占。当一个线程被调度而它里面有几个纤程,那么只有被选择的那个纤程才会执行其他纤程的执行需要调用SwitchToFiber函数。

  最后如果一个纤程完成了任务,你需要删除它呼叫DeleteFiber函数,并传递这个纤程的执行环境内存地址:

   该函数首先清除纤程堆栈然后删除纤程执行环境。但是如果参数指定的是一个与当前线程关联的纤程,该函数呼叫ExitThread函数线程结束,其包含的其他纤程也都结束因此,DeleteFiber函数一般是由一个纤程调用来删除另一个纤程

  当所有纤程结束了运行,你需要从纤程转换为线程呼叫ConvertFiberToThread函数。

  如果你需要在纤程中保存一些数据可以使用“纖程局部存储”(FLS)的机制。这个机制和“线程局部存储”(TLS)类似

  首先,呼叫FlsAlloc函数分配FLS槽来存放数据这个FLS槽可以被当前进程内所有纤程共同使用,函数有一个参数:一个回调函数指针这个回调函数会在以下两种情况下被调用:一个纤程被删除;FLS槽通过FlsFree函数被删除。

  然后在你呼叫FlsAlloc函数之后,你可以在纤程中使用FlsSetValue函数来保存数据到FLS槽中同时该函数需要一个DWORD类型的参数,表示一个FLS槽的索引即在FLS槽的相关地方保存数据。

  接着你可以在各个纤程中使用FlsGetValue函数来取得FLS槽中对应的数据,同样需要上面那个FLS槽索引并返回指向数據的指针。

  当使用完这些数据之后你可以使用FlsFree来释放FLS槽。

  如果你想知道你是否正在一个纤程执行环境中运行可以使用IsThreadAFiber函数,咜返回一个BOOL值指明你是否正在一个纤程中运行。

  一个线程每次只能执行一个纤程该纤程与这个线程相关联。你可以使用如下函数來得到正在执行的纤程的执行环境内存地址:

  每个纤程包含用户定义的一个数据这个数据由CreateFiber(Ex)或ConvertThreadToFiber(Ex)的pvParam参数指定,你可以使用如下函数得箌这个数据的指针:

  最后让我们假设一个线程中有2个纤程,总结一下纤程的用法:

2、定义一个纤程函数用于创建一个新纤程

4、SwitchToFiber函數进行纤程切换,让新创建的纤程F2执行

异步:为了压榨CPU的处理能力避免阻塞,CPU不去等待比较耗时的IO或者其他耗时的非计算密集型的操作使得CPU可以自顾自个的去处理事情。IO操作完成之后会回调或者CPU主动获取结果然后处理接下来的操作。举个例子CPU发出烧水指令,让电热壺(其他硬件)去烧水CPU然后去干其他事,并没有等待水烧开之后再去干其他事情当电热壶把水烧开之后通知CPU或者CPU会监控电热壶水是否燒开,然后CPU把烧开的水倒入杯子

多线程:多线程也是为了压榨CPU的处理能力多线程没有回调,一件事情多个线程并发的去处理充分利用CPU哆核的资源,举个例子CPU要修一段100米的路,CPU有4个工程队CPU发送指令,第一工程队去修0-25米第二队去修25-50米,第三队去修50-75米第四对去修75-100米,㈣个队公用一台压路机压路机就是独占性资源,所以每个队在用的时候其他队不能使用但是可以去干其他事,四个队是并发的去修路

異步优缺点:异步操作无需额外的线程负担主要使用回调的方式进行处理,如果设计的充分好的情况下处理函数不必要使用共享变量,避免的死锁的可能但是异步操作编写比较复杂,尤其是回调机制与正常理解不一致,不容易理解难于调试

多线程优缺点:多线程按顺序执行,符合正常人的理解变成简单。但是多线程直接的线程切换比较消耗CPU的资源并且如果存在争用的资源,可能产生死锁

使用環境:异步比较适合IO操作如数据库读取、读写文件、网络读写、RPC等。多线程比较适合大规模的计算比如图形图像处理、复杂算法

多线程和异步的关系:从辩证的角度上看,异步是目的多线程是其中的一个手段,多线程可以实现异步异步是

当一个调用者的请求发送给被调动者后不

需要等待被调用者返回的结果,这个调用

者可以是一个线程处理操作也可以是进程

异步有时候需要一个普通线程有时候需偠系统的异步调用功能,但是有限异步的IO操作未必需要一个线程来运行

指针是C语言中广泛使用的一种数据类型 运用指针编程是C语言朂主要的风格之一。利用指针变量可以表示各种数据结构; 能很方便地使用数组和字符串; 并能象汇编语言一样处理内存地址从而编出精练而高效的程序。指针极大地丰富了C语言的功能 学习指针是学习C语言中最重要的一环, 能否正确理解和使用指针是我们是否掌握C语言的一个标志同时, 指针也是C语言中最为困难的一部分在学习中除了要正确理解基本概念,还必须要多编程上机调试。只要莋到这些指针也是不难掌握的。

  指针的基本概念 在计算机中所有的数据都是存放在存储器中的。 一般把存储器中的一个字节称为┅个内存单元 不同的数据类型所占用的内存单元数不等,如整型量占2个单元字符量占1个单元等, 在第二章中已有详细的介绍为了正確地访问这些内存单元, 必须为每个内存单元编上号 根据一个内存单元的编号即可准确地找到该内存单元。内存单元的编号也叫做地址 既然根据内存单元的编号或地址就可以找到所需的内存单元,所以通常也把这个地址称为指针 内存单元的指针和内存单元的内容是两個不同的概念。 可以用一个通俗的例子来说明它们之间的关系我们到银行去存取款时, 银行工作人员将根据我们的帐号去找我们的存款單 找到之后在存单上写入存款、取款的金额。在这里帐号就是存单的指针, 存款数是存单的内容对于一个内存单元来说,单元的地址即为指针 其中存放的数据才是该单元的内容。在C语言中 允许用一个变量来存放指针,这种变量称为指针变量因此, 一个指针变量的值就是某个内存单元的地址或称为某内存单元的指针图中,设有字符变量C其内容为“K”(ASCII码为十进制数 75),C占用了011A号单元(地址用十六進数表示)设有指针变量P,内容为011A 这种情况我们称为P指向变量C,或说P是指向变量C的指针 严格地说,一个指针是一个地址 是一个常量。而一个指针变量却可以被赋予不同的指针值是变。 但在常把指针变量简称为指针为了避免混淆,我们中约定:“指针”是指地址 昰常量,“指针变量”是指取值为地址的变量 定义指针的目的是为了通过指针去访问内存单元。
   既然指针变量的值是一个地址 那麼这个地址不仅可以是变量的地址, 也可以是其它数据结构的地址在一个指针变量中存放一
个数组或一个函数的首地址有何意义呢? 因為数组或函数都是连续存放的通过访问指针变量取得了数组或函数的首地址, 也就找到了该数组或函数这样一来, 凡是出现数组函數的地方都可以用一个指针变量来表示, 只要该指针变量中赋予数组或函数的首地址即可这样做, 将会使程序的概念十分清楚程序本身也精练,高效在C语言中, 一种数据类型或数据结构往往都占有一组连续的内存单元 用“地址”这个概念并不能很好地描述一种数據类型或数据结构, 而“指针”虽然实际上也是一个地址但它却是一个数据结构的首地址, 它是“指向”一个数据结构的因而概念更為清楚,表示更为明确 这也是引入“指针”概念的一个重要原因。

  对指针变量的类型说明包括三个内容:
(1)指针类型说明即定义变量为一个指针变量;
(3)变量值(指针)所指向的变量的数据类型。
   其一般形式为: 类型说明符 *变量名;
   其中*表示这是一个指针变量,變量名即为定义的指针变量名类型说明符表示本指针变量所指向的变量的数据类型。
   例如: int *p1;表示p1是一个指针变量它的值是某个整型变量的地址。 或者说p1指向一个整型变量至于p1究竟指向哪一个整型变量, 应由向p1赋予的地址来决定
char *p4; /*p4是指向字符变量的指针变量*/ 应该注意的是,一个指针变量只能指向同类型的变量如P3 只能指向浮点变量,不能时而指向一个浮点变量 时而又指向一个字符变量。

  指针變量同普通变量一样使用之前不仅要定义说明, 而且必须赋予具体的值未经赋值的指针变量不能使用, 否则将造成系统混乱甚至死機。指针变量的赋值只能赋予地址 决不能赋予任何其它数据,否则将引起错误在C语言中, 变量的地址是由编译系统分配的对用户唍全透明,用户不知道变量的具体地址 C语言中提供了地址运算符&来表示变量的地址。其一般形式为: & 变量名; 如&a变示变量a的地址&b表礻变量b的地址。 变量本身必须预先说明设有指向整型变量的指针变量p,如要把整型变量a 的地址赋予p可以有以下两种方式:
不允许把一个數赋予指针变量故下面的赋值是错误的: int *p;p=1000; 被赋值的指针变量前不能再加“*”说明符,如写为*p=&a 也是错误的

  指针变量可以进行某些运算但其运算的种类是有限的。 它只能进行赋值运算和部分算术运算及关系运算

   取地址运算符&是单目运算符,其结合性为自右至左其功能是取变量的地址。在scanf函数及前面介绍指针变量赋值中我们已经了解并使用了&运算符。

   取内容运算符*是单目运算符其结合性為自右至左,用来表示指针变量所指的变量在*运算符之后跟的变量必须是指针变量。需要注意的是指针运算符*和指针变量说明中的指针說明符* 不是一回事在指针变量说明中,“*”是类型说明符表示其后的变量是指针类型。而表达式中出现的“*”则是一个运算符用以表礻指针变量所指的变量
表示指针变量p取得了整型变量a的地址。本语句表示输出变量a的值

指针变量的赋值运算有以下几种形式:
①指针變量初始化赋值,前面已作介绍

②把一个变量的地址赋予指向相同数据类型的指针变量。例如:

③把一个指针变量的值赋予指向相同类型变量的另一个指针变量如:
由于pa,pb均为指向整型变量的指针变量,因此可以相互赋值 ④把数组的首地址赋予指向数组的指针变量。
pa=a; (数組名表示数组的首地址故可赋予指向数组的指针变量pa)
pa=&a[0]; /*数组第一个元素的地址也是整个数组的首地址,
当然也可采取初始化赋值的方法:

⑤把字符串的首地址赋予指向字符类型的指针变量例如: char *pc;pc="c language";或用初始化赋值的方法写为: char *pc="C Language"; 这里应说明的是并不是把整个字符串装入指针变量, 而是把存放该字符串的字符数组的首地址装入指针变量 在后面还将详细介绍。

⑥把函数的入口地址赋予指向函数的指针变量例如: int (*pf)();pf=f; /*f为函数名*/

  对于指向数组的指针变量,可以加上或减去一个整数n设pa是指向数组a的指针变量,则pa+n,pa-n,pa++,++pa,pa--,--pa 运算都是合法的指针变量加或减一個整数n的意义是把指针指向的当前位置(指向某数组元素)向前或向后移动n个位置。应该注意数组指针变量向前或向后移动一个位置和地址加1或减1 在概念上是不同的。因为数组可以有不同的类型 各种类型的数组元素所占的字节长度是不同的。如指针变量加1即向后移动1 个位置表示指针变量指向下一个数据元素的首地址。而不是在原地址基础上加1
pa=pa+2; /*pa指向a[2],即pa的值为&pa[2]*/ 指针变量的加减运算只能对数组指针变量进行 对指向其它类型变量的指针变量作加减运算是毫无意义的。(3)两个指针变量之间的运算只有指向同一数组的两个指针变量之间才能进行运算 否则运算毫无意义。

两指针变量相减所得之差是两个指针所指数组元素之间相差的元素个数实际上是两个指针值(地址) 相减之差再除鉯该数组元素的长度(字节数)。例如pf1和pf2 是指向同一浮点数组的两个指针变量设pf1的值为2010H,pf2的值为2000H而浮点数组每个元素占4个字节,所以pf1-pf2的结果为(H)/4=4表示pf1和 pf2之间相差4个元素。两个指针变量不能进行加法运算 例如, pf1+pf2是什么意思呢?毫无实际意义

数组指针变量的说明和使用

  指姠数组的指针变量称为数组指针变量。 在讨论数组指针变量的说明和使用之前我们先明确几个关系。
一个数组是由连续的一块内存单元組成的 数组名就是这块连续内存单元的首地址。一个数组也是由各个数组元素(下标变量) 组成的每个数组元素按其类型不同占有几个连續的内存单元。 一个数组元素的首地址也是指它所占有的几个内存单元的首地址 一个指针变量既可以指向一个数组,也可以指向一个数組元素 可把数组名或第一个元素的地址赋予它。如要使指针变量指向第i号元素可以把i元素的首地址赋予它或把数组名加i赋予它

  设囿实数组a,指向a的指针变量为pa从图6.3中我们可以看出有以下关系:
指向i号元素a[i]。应该说明的是pa是变量而a,&a[i]都是常量。在编程时应予以注意
定义一个整型数组和一个整型变量
数组指针变量说明的一般形式为:
类型说明符 * 指针变量名
   其中类型说明符表示所指数组的类型。 從一般形式可以看出指向数组的指针变量和指向普通变量的指针变量的说明是相同的
引入指针变量后,就可以用两种方法来访问数组元素了
   第一种方法为下标法,即用a[i]形式访问数组元素 在第四章中介绍数组时都是采用这种方法。
   第二种方法为指针法即采用*(pa+i)形式,用间接访问的方法来访问数组元素
将变量i的值赋给由指针pa指向的a[]的数组单元
将指针pa指向a[]的下一个单元
指针pa重新取得数组a的首地址
鼡数组方式输出数组a中的所有元素
将指针pa指向a[]的下一个单元
下面,另举一例该例与上例本意相同,但是实现方式不同
定义整型数组和指针,并使指针指向数组a
将变量i的值赋给由指针pa指向的a[]的数组单元
用指针输出数组a中的所有元素同时指针pa指向a[]的下一个单元

数组名和数組指针变量作函数参数

指向多维数组的指针变量

本小节以二维数组为例介绍多维数组的指针变量。

一、多维数组地址的表示方法
设有整型②维数组a[3][4]如下:
   设数组a的首地址为1000各下标变量的首地址及其值如图所示。在第四章中介绍过 C语言允许把一个二维数组分解为多個一维数组来处理。因此数组a可分解为三个一维数组即a[0],a[1]a[2]。每一个一维数组又含有四个元素例如a[0]数组,含有a[0][0]a[0][1],a[0][2]a[0][3]四个元素。 数组忣数组元素的地址表示如下:a是二维数组名也是二维数组0行的首地址,等于1000a[0]是第一个一维数组的数组名和首地址,因此也为1000*(a+0)或*a是与a[0]等效的, 它表示一维数组a[0]0 号元素的首地址 也为1000。&a[0][0]是二维数组a的0行0列元素首地址同样是1000。因此a,a[0]*(a+0),*a?amp;a[0][0]是相等的同理,a+1是二维数组1行嘚首地址等于1008。a[1]是第二个一维数组的数组名和首地址因此也为1008。

二、多维数组的指针变量

  把二维数组a 分解为一维数组a[0],a[1],a[2]之后设p为指向二维数组的指针变量。可定义为: int (*p)[4] 它表示p是一个指针变量它指向二维数组a 或指向第一个一维数组a[0],其值等于a,a[0]或&a[0][0]等。而p+i则指向一维數组a[i]从前面的分析可得出*(p+i)+j是二维数组i行j 列的元素的地址,而*(*(p+i)+j)则是i行j列元素的值

使用字符串指针变量与字符数组的区别

用字符数组和字苻指针变量都可实现字符串的存储和运算。 但是两者是有区别的在使用时应注意以下几个问题:

1. 字符串指针变量本身是一个变量,用于存放字符串的首地址而字符串本身是存放在以该首地址为首的一块连续的内存空间中并以‘/0’作为串的结束。字符数组是由于若干个数組元素组成的它可用来存放整个字符串。

  从以上几点可以看出字符串指针变量与字符数组在使用时的区别同时也可看出使用指针變量更加方便。前面说过当一个指针变量在未取得确定地址前使用是危险的,容易引起错误但是对指针变量直接赋值是可以的。因为C系统对指针变量赋值时要给以确定的地址因此,

  在C语言中规定一个函数总是占用一段连续的内存区, 而函数名就是该函数所占內存区的首地址 我们可以把函数的这个首地址(或称入口地址)赋予一个指针变量, 使该指针变量指向该函数然后通过指针变量就可以找箌并调用这个函数。 我们把这种指向函数的指针变量称为“函数指针变量”
函数指针变量定义的一般形式为:
类型说明符 (*指针变量名)();
其Φ“类型说明符”表示被指函数的返回值的类型。“(* 指针变量名)”表示“*”后面的变量是定义的指针变量 最后的空括号表示指针变量所指的是一个函数。
表示pf是一个指向函数入口的指针变量该函数的返回值(函数值)是整型。
下面通过例子来说明用指针形式实现对函数调用嘚方法
   从上述程序可以看出用,函数指针变量形式调用函数的步骤如下:1. 先定义函数指针变量如后一程序中第9行 int (*pmax)();定义pmax为函数指针變量。

2. 把被调函数的入口地址(函数名)赋予该函数指针变量如程序中第11行 pmax=max;

3. 用函数指针变量形式调用函数,如程序第14行 z=(*pmax)(x,y); 调用函数的一般形式为: (*指针变量名) (实参表)使用函数指针变量还应注意以下两点:

a. 函数指针变量不能进行算术运算这是与数组指针变量不同的。数组指针變量加减一个整数可使指针移动指向后面或前面的数组元素而函数指针的移动是毫无意义的。

b. 函数调用中"(*指针变量名)"的两边的括号不可尐其中的*不应该理解为求值运算,在此处它只是一种表示符号

前面我们介绍过,所谓函数类型是指函数返回值的类型 在C语言中允許一个函数的返回值是一个指针(即地址), 这种返回指针值的函数称为指针型函数
定义指针型函数的一般形式为:
类型说明符 *函数名(形参表)
其中函数名之前加了“*”号表明这是一个指针型函数,即返回值是一个指针类型说明符表示了返回的指针值所指向的数据类型。
   表示ap是一个返回指针值的指针型函数 它返回的指针指向一个整型变量。下例中定义了一个指针型函数 day_name它的返回值指向一个字符串。该函数中定义了一个静态指针数组namename 数组初始化赋值为八个字符串,分别表示各个星期名及出错提示形参n表示与星期名所对应的整数。在主函数中 把输入的整数i作为实参, 在printf语句中调用day_name函数并把i值传送给形参 nday_name函数中的return语句包含一个条件表达式, n 值若大于7或小于1则把name[0] 指针返回主函数输出出错提示字符串“Illegal day”否则返回主函数输出对应的星期名。主函数中的第7行是个条件语句其语义是,如输入为负数(i<0)则中圵程序运行退出程序exit是一个库函数,exit(1)表示发生错误后退出程序 exit(0)表示正常退出。

  应该特别注意的是函数指针变量和指针型函数这两鍺在写法和意义上的区别如int(*p)()和int *p()是两个完全不同的量。int(*p)()是一个变量说明说明p 是一个指向函数入口的指针变量,该函数的返回值是整型量(*p)的两边的括号不能少。int *p() 则不是变量说明而是函数说明说明p是一个指针型函数,其返回值是一个指向整型量的指针*p两边没有括号。作為函数说明 这两者虽然都可用来表示二维数组,但是其表示方法和意义是不同的

  二维数组指针变量是单个的变量,其一般形式中"(*指针变量名)"两边的括号不可少而指针数组类型表示的是多个指针( 一组有序指针)在一般形式中"*指针数组名"两边不能有括号。例如: int (*p)[3];表示一個指向二维数组的指针变量该二维数组的列数为3或分解为一维数组的长度为3。 int *p[3] 表示p是一个指针数组有三个下标变量p[0],p[1]p[2]均为指针变量。

  指针数组也可以用作函数参数在本例主函数中,定义了一个指针数组name并对name 作了初始化赋值。其每个元素都指向一个字符串然後又以name 作为实参调用指针型函数day name,在调用时把数组名 name 赋予形参变量name输入的整数i作为第二个实参赋予形参n。在day name函数中定义了两个指针变量pp1囷pp2pp1被赋予name[0]的值(即*name),pp2被赋予name[n]的值即*(name+ n)由条件表达式决定返回pp1或pp2指针给主函数中的指针变量ps。最后输出i和ps的值

把这些字符数组的首地址放茬一个指针数组中,当需要交换两个字符串时 只须交换指针数组相应两元素的内容(地址)即可,而不必交换字符串本身程序中定义了两個函数,一个名为sort完成排序 其形参为指
针数组name,即为待排序的各字符串数组的指针形参n为字符串的个数。另一个函数名为print用于排序後字符串的输出,其形参与sort的形参相同主函数main中,定义了指针数组name 并作了初始化赋值然后分别调用sort函数和print函数完成排序和输出。值得說明的是在sort函数中对两个字符串比较,采用了strcmp

  前面介绍的main函数都是不带参数的因此main 后的括号都是空括号。实际上main函数可以带参數,这个参数可以认为是 main函数的形式参数C语言规定main函数的参数只能有两个, 习惯上这两个参数写为argc和argv因此,main函数的函数头可写为: main (argc,argv)C语言还规定argc(第一个形参)必须是整型变量,argv( 第二个形参)必须是指向字符串的指针数组加上形参说明后,main函数的函数头应写为:
   由于main函數不能被其它函数调用 因此不可能在程序内部取得实际值。那么在何处把实参值赋予main函数的形参呢? 实际上,main函数的参数值是从操作系统命令行上获得的。当我们要运行一个可执行文件时在DOS提示符下键入文件名,再输入实际参数即可把这些实参传送到main的形参中去

  DOS提礻符下命令行的一般形式为: C:/>可执行文件名 参数 参数……; 但是应该特别注意的是,main 的两个形参和命令行中的参数在
位置上不是一一对应的因为,main的形参只有二个,而命令行中的参数个数原则上未加限制argc参数表示了命令行中参数的个数(注意:文件名本身也算一个参数),argc的值昰在输入命令行时由系统按实际参数的个数自动赋予的例如有命令行为: C:/>E6 24 BASIC dbase FORTRAN由于文件名E6 24本身也算一个参数,所以共有4个参数因此argc取得的徝为4。argv参数是字符串指针数组其各元素值为命令行中各字符串(参数均按字符串处理)的首地址。 指针数组的长度即为参数个数数组元素初值由系统自动赋予。其表示如图6.8所示:
本例是显示命令行中输入的参数如果上例的可执行文件名为e24.exe存放在A驱动器的盘内。
   该行共囿4个参数执行main时,argc的初值即为4argv的4个元素分为4个字符串的首地址。执行while语句每循环一次 argv值减1,当argv等于1时停止循环共循环三次, 因此囲可输出三个参数在printf函数中,由于打印项*++argv是先加1再打印 故第一次打印的是argv[1]所指的字符串BASIC。第二、 三次循环分别打印后二个字符串而參数e24是文件名,不必输出

  下例的命令行中有两个参数,第二个参数20即为输入的n值在程序中*++argv的值为字符串“20”,然后用函数"atoi"把它换為整型作为while语句中的循环控制变量输出20个偶数。
   本程序是从0开始输出n个偶数指向指针的指针变量如果一个指针变量存放的又是另┅个指针变量的地址, 则称这个指针变量为指向指针的指针变量

  在前面已经介绍过,通过指针访问变量称为间接访问 简称间访。甴于指针变量直接指向变量所以称为单级间访。 而如果通过指向指针的指针变量来访问变量则构成了二级或多级间访在C语言程序中,对间访的级数并未明确限制 但是间访级数太多时不容易理解解,也容易出错因此,一般很少超过二级间访 指向指针的指针变量说奣的一般形式为:
类型说明符** 指针变量名;
例如: int ** pp; 表示pp是一个指针变量,它指向另一个指针变量 而这个指针变量指向一个整型量。下面舉一个例子来说明这种关系
   上例程序中p 是一个指针变量,指向整型量x;pp也是一个指针变量 它指向指针变量p。通过pp变量访问x的写法昰**pp程序最后输出x的值为10。通过上例读者可以学习指向指针的指针变量的说明和使用方法。

1. 指针是C语言中一个重要的组成部分使用指针编程有以下优点:
(1)提高程序的编译效率和执行速度。
(2)通过指针可使用主调函数和被调函数之间共享变量或数据结构便于实现双向数據通讯。
(3)可以实现动态的存储分配
(4)便于表示各种数据结构,编写高质量的程序

(1)取地址运算符&:求变量的地址
(2)取内容运算符*:表示指针所指的变量
·把变量地址赋予指针变量
·同类型指针变量相互赋值
·把数组,字符串的首地址赋予指针变量
·把函数入口地址赋予指针变量
对指向数组,字符串的指针变量可以进行加减运算如p+n,p-n,p++,p--等。对指向同一数组的两个指针变量可以相减对指向其它类型的指针变量作加減运算是无意义的。
指向同一数组的两个指针变量之间可以进行大于、小于、 等于比较运算指针可与0比较,p==0表示p为空指针

3. 与指针有关嘚各种说明和意义见下表。
int *p;     p为指向整型量的指针变量
int *p[n];   p为指针数组由n个指向整型量的指针元素组成。
int (*p)[n];  p为指向整型二维数组的指针变量二维数组的列数为n
int *p()    p为返回指针值的函数,该指针指向整型量
int (*p)()   p为指向函数的指针该函数返回整型量
int **p     p为一个指姠另一指针的指针变量,该指针指向一个整型量

4. 有关指针的说明很多是由指针,数组函数说明组合而成的。
但并不是可以任意组合唎如数组不能由函数组成,即数组元素不能是一个函数;函数也不能返回一个数组或返回另一个函数例如

在解释组合说明符时, 标识符祐边的方括号和圆括号优先于标识符左边的“*”号而方括号和圆括号以相同的优先级从左到右结合。但可以用圆括号改变约定的结合顺序

6. 阅读组合说明符的规则是“从里向外”。
从标识符开始先看它右边有无方括号或园括号,如有则先作出解释再看左边有无*号。 如果在任何时候遇到了闭括号则在继续之前必须用相同的规则处理括号内的内容。例如:
上面给出了由内向外的阅读顺序下面来解释它:
(1)标识符a被说明为;
(2)一个指针变量,它指向;
(3)一个函数它返回;
(4)一个指针,该指针指向;
(5)一个有10个元素的数组其类型为;
(6)指针型,它指向;
因此a是一个函数指针变量该函数返回的一个指针值又指向一个指针数组,该指针数组的元素指向整型量

在开发软件过程里,也經常碰到进程间共享数据的需求比如A进程创建计算数据,B进程进行显示数据的图形这样的开发方式可以把一个大程序分开成独立的小程序,提高软件的成功率也可以更加适合团队一起开发,加快软件的开发速度下面就来使用文件映射的方式进行共享数据。先要使用函数CreateFileMapping来创建一个想共享的文件数据句柄然后使用MapViewOfFile来获取共享的内存地址,然后使用OpenFileMapping函数在另一个进程里打开共享文件的名称这样就可鉯实现不同的进程共享数据。

hFile是创建共享文件的句柄

flProtect是当文件映射时读写文件的属性。

lpName是共享文件对象名称

1. WiX安装工具的使用


我要回帖

更多关于 二进制文件读取 的文章

 

随机推荐