Fortran 中根据语义的补全

Fortran 中的 if 结构，函数声明等，都有不少的信息冗余。如

if (3 > 2) then
    !...
endif

real function add(a, b)  
...
end function

后面的 endif, end function 等，长度都不少。这样虽然提高了可读性，但手动敲下未免还是太麻烦。把时间花在敲入一个很长还必定会有的东西上面，很不划算。如果用 snippet 之类的方案，需要记住一个 key, 然后每次按 tab 展开，除了语言本身，又多了一个记忆 key 的负担。

于是，我想到了一个更为自动化的补全方案，就是让程序根据已经输入的内容，在敲入回车键换行时，自己判定这是不是一个未完成的 if 结构，然后自动在后面补全 endif.

因为这个功能绑定到了一个很重要的按键上，所以功能要尽量的不添乱。所以，我想到把当前行按照程序语义给解析出来。如果能成功的解析，就补全后面的内容；如果不行，就执行普通的Enter.

解析程序的语义，还可以带来另外的好处。一个是自动加空白，如

do i=1,n

给自动化成为

do i = 1, n

有了空格之后更加的好读。另一个功能是把一些冗余的东西省掉，如

if (a > 3) then

有用的信息只有

if a > 3

因此，只需要敲下上面的文字，再回车，就可以补全成符合 Fortran 语法规范的形式。

代码在此 https://github.com/fermat618/fortran-construct-complete

整数，小数；整型，浮点型

这四个概念，前面两个，表示数学中的整数，小数；后面两个，表示计算机中相应的表示。

在C语言中，整数一般用整型表示，而小数一般用浮点型来表示。先学C语言的人往往容易对此有固定的印象。同时会觉得浮点型表示的数都是不精确的。然而，这个印象是不准确的

浮点型数也可以表示整数，而且在整数不是非常大的情况下，这种表示是精确的。对浮点型表示的整数，进行加、减、乘操作，得到的仍是精确的结果。仍可以用来表示长度，表示数组下标等。

在很久以前，浮点数的计算很慢。然后，现在的发展下浮点数的计算已经快多了。而对于脚本语言来说，速度往往不是那么的重要。Cpython 的运行要比相应的C语言慢100倍左右。这时，使用整型来表示整数的速度优势完全没有了，而空间优势也不大。所以，在脚本语言中区分整型和浮点型已经是件很尴尬的事。而 Javascript 的数值类型已经默认只有一个，就是浮点型。Matlab 的默认类型也已经是浮点型。Python 3 中 int 已经默认可以为任意大的整数，算是给整型的存在又找回了点面子。

Python 中的 sum 函数

做 projecteuler.net 上面的题时，遇到一个问题，需要对某个范围内的数进行筛选，并且把所有符合的结果都给出来。直接些的做法是做一个数组，在筛选的时候，遇到符合条件的，就放进那个数组里面。但维护状态容易出错，我尽量避免。另一种做法就是

def foo(n):
    if p2(n):
        return [a]
    else:
        return []

然后把结果集合在一起。

集合在一起的方法在 Haskell 里面就很多了 concat, join, >>= id 等。Python 里面，我首先想到的就是用 reduce 和 + 弄了个。

from functools import reduce
from operator import add

reduce(add, map(foo, range(10000)), [])

但看着总是有些不爽。因为对于普通数的相加，一个 sum() 函数就搞定了，哪用得着那么麻烦。于是试了一下

sum(foo(x) for x in range(10000))

报错，再了看那错误信息，说是什么 int 不能和 list 相加。然后又去查了一下 sum 函数的文档

sum(iterable[, start]) -> value

Returns the sum of an iterable of numbers (NOT strings) plus the value
of parameter 'start' (which defaults to 0).  When the iterable is
empty, returns start.

虽然上面写了是求数值的和，而不是字符串的，我还是试了下把最后面的那个参数置为 []

sum((foo(x)for x in range(10000)), [])

果然是可以啊。

接着我试了一下字符串的相加，得到一个有意思的错误。

sum(['foo','bar'],'')
TypeError: sum() can't sum strings [use ''.join(seq) instead]

它报了个错，然后给了个更好的写法。

''.join(seq)

用这个作为一大串字符串的相加，不但可读性好，而且效率上可以预期将比 sum() 函数的直接使用加法把字符串联接起来要好。这点在 PEP8 里面也说过，虽然 Cpython 实现的字符串的 += 运算符比较高效，但不能对其它实现作如此预期。

s = ''
for s2 in xxx:
    s += bar(s2)

的代码应该写成

''.join(bar(s2) for s2 in xxx)

debian 下编译安装同时支持 python2 和 python3 的 vim

Debian 下编译安装同时支持 python2 与 python3 的 vim

由于 python 相比 vim 原来的那个脚本实在是强太多，我转到用 python 来写 vim 代码了，并且是坚定的 python3.

而有两个我想用的 vim 插件却是 python2 的，自己改成 python3 版本的话工作量太大，而且升级的时候又得操心。

以前在 Debian 下编译的 vim 无论怎么都没法做到同时支持 python2 与 python3. 最好的情况是，编译好后同时有 +python/dyn 与 +python3/dyn 特性，但只要执行了其中一个 python 版本的命令，另一个 python 版本的命令便无法执行。

后来发现是 Debian 自带的那个 python 的问题，具体问题我忘了。

既然系统自带的那个有问题，解决的办法就是自己安装一个没问题的 python 了。但系统的 python 不能随便换，否则遇到的麻烦接连不断。那就编译一个 vim 专用的 python 吧，不放在 $PATH 当中，也不影响系统原来的 python 和其它程序。

编译 vim 专用 python, 安装目录当然就放在 vim 的目录之来了。下载 python2 与 python3 的源代码，并如此

./configure --prefix=/usr/local/share/vim/usr --enable-shared

定义 ./configure 时的选项。这样安装时就自动安装到 vim 所属的目录下面了，并且其共享库也编译好了。

然后就是编译 vim 了。经试验，改如下两个环境变量

PATH=/usr/local/share/vim/usr/bin:$PATH
LD_RUN_PATH=/usr/local/share/vim/usr/lib
export PATH LD_RUN_PATH

之后，再进行 ./configure $PATH 环境变量，决定 vim 找到的 python 的位置。而 $LD_RUN_PATH 环境变量，则是链接 vim 时所需要的，可以让 vim 找到 python 的 so 文件的位置。有了这个之后便不再需要 $LD_LIBRARY_PATH 变量了。

./configure \
        --with-features=huge \
        --enable-python3interp \
        --enable-pythoninterp

接着 make 完成后测试 ./src/vim 不出问题的话，就可以成功了。

需要注意的是，每次成功编译后，需要执行

make clean && make distclean

否则不能编译成功。

安装好后再看两个 python 所占大小，才区区 202MB ，想一下可以不费劲地用现有的 python2 的插件了，真是很划得来啊。

Date: 2012-10-22 21:59:33 CST

Author: fermat

Org version 7.7 with Emacs version 24

Validate XHTML 1.0

掉 intel fortran 编译器返回派生类型的方式的坑里了

最近写 matlab 与 Fortran 的混编程序时，为了使程序写起来更容易，采用了 Fortran 2003 中 iso_c_binding 模块的一些内容。这些内容的采用使得那些接口写起来更容易了，本来松了一口气，想换到 intel fortran 编译器下的时候，又来了那个让我一看到就头疼的段错误。

然后又得开始调试了。在仔细查看了程序后，没发现有问题。然后开始写小程序测试里面用到的语句。吸引以前的教训，现在仔细检查调用 matlab mex API 后的返回值。可是 type(c_ptr), 这个 iso_c_binding 模块中规定的放 C 指针值的数据类型，却没法打印出来看。

通过 locate iso_c_binding 命令。找到了 intel 的 iso_c_binding.f90 这个文件。打开后查看其内容，发现

type, bind(c) :: c_ptr
integer(xx), private :: ptr
end type

type(c_ptr) 的内容被声明为了私有的。把这个文件拿出来，去掉 private 属性，再手动编译，总算是可以看到 type(c_ptr) 的内容了。把同一个 mex 程序用 intel fortran 与 gnu fortran 编译器分别编译两份，再开一个 matlab, 在里面声明一个变量，传进去，查看各个函数的返回，找到了 mxGetPr 函数返回的结果不对。

又另写了一个函数，把 mxGetPr 函数的返回值申明为 integer(8), 再看结果，却又是对的了。

终于定位到了是 integer*8 和 type(c_ptr) 的区别，才想到可能是 intel 对于后一种可能采取了不是传值而是传值的方式。另写函数一验证，果然如此。

派生类型与内置类型一样，也是标量。同样的标量，在 intel fortran 中的处理，却是很不相同，这很超出我预期。这种处理方式真是相当的不统一。标量传值，矢量传址，这才是统一的方式嘛。

又试了给函数加上 bind(c) 属性，这次终于可以传值了。但是加上了这个属性的函数，其编译出来的文件的符号的处理又跟普通的 fortran 函数不一样了。 matlab 给 Fortran 的那些 api 的符号名本来是按照 fortran 来的，这么一来就得在 bind(c, name=xxx) 里面写明了。使用 nm 得到实际的符号名后，写死在里面，再加上条件编译，总算是使得 gfortran 与 intel fortran 都可以编译那个程序了，代价就是只能用在 64 平台及开启了 -largeArrayDims 选项的情况下了。

vim打开文件时自动添加cscope连接

cscope是看源代码的得力工具。在编译进了cscope特性的vim中，可以在vim内部方便地使用cscope进行跳转. 使用cscope需要先生成一个默认文件名是cscope.out的交叉引用文件，在vim中使用cscope也需要使用:cscope add 命令指定交叉引用文件所在位置，也即所谓的建立cscope链接。

通常，cscope.out会在一个项目的根目录下面。当在这个目录下打开vim时，使用vim的cscope相关部分给出的示例设置

		if filereadable("cscope.out")
		    cs add cscope.out
		" else add database pointed to by environment
		elseif $CSCOPE_DB != ""
		    cs add $CSCOPE_DB
		endif

可以自动添加cscope.out文件。然而，当在一个项目的子目录下打开一个文件的时候，这份配置却不能正确添加cscope.out文件了。往往用cscope开始查找某个东西的时候，就提示说没有建立cscope链接，很是扫兴。

想做什么事被打断是很不爽的，所以就需要自动添加cscope.out文件了。比较直接的想法就是从当前目录一层一层地向上查找，如果找到了某个cscope.out文件，就把它添加进来。考虑到python3代码写起来比vim脚本爽多了，而我的vim又是自己编译几乎必带这个支持的，所以就在vimscript中用python3来实现了。

if has("cscope") && executable("cscope")
    if has('python3')
        py3 <<EOF
import os, os.path
from itertools import takewhile
def iterate(fun, x):
    yield x
    for element in iterate(fun, fun(x)):
        yield element
for path in takewhile(lambda x: x!='/', iterate(os.path.dirname, os.getcwd())):
    cscopefile = os.path.join(path, 'cscope.out')
    if os.access(cscopefile, os.R_OK): # file readable
        vim.command('cscope add ' + cscopefile +' '+ path)
        break
EOF
    endif
    if $CSCOPE_DB != ""
	cs add $CSCOPE_DB
    endif
endif

用python的好处是容易让代码成为自己想法的自然表达。程序的目的是在当前目录及其父目录中检查cscope.out文件的存在，再添加这个文件，那么这个程序自然的结构就是首先得到当前目录和它的父目录，然后再对这些目录进行一个一个地检查。生成父目录的方式就是对一个目录不停地用basename函数，想到一个生成某个函数对一个值不断应用而产生的序列的函数 iterate(), python 的itertools中竟然没有，那就自己定义一个吧。python的生成器使得程序既不会在当前目录下已经找到cscope.out的时候还去傻傻地生成当前目录的所有父目录的列表，还能让程序看起来很漂亮。用for in结构可比while漂亮。

最后再说下vim中的:cscope add命令。cscope.out文件中需要保存文件所在的位置，而这个位置通常是相对位置。如果vim的当前目录与生成cscope.out时的当前目录不一样，vim就会找不到cscope给出的文件位置。所以，就需要显示式指定cscope.out里面的路径是相对于哪个目录的，这就是cscope add命令的第二个参数。第一个参数自然就是cscope.out文件的路径了。

Fermat618's Blog

Happy coding