每月初,创腾科技生命科学模拟技术部都会通过微信公众号定期总结 BIOVIA Discovery Studio 用户在软件使用过程中产生的一些具有代表性的问题。基于我们的工程师团队在分子模拟领域内十多年的经验,定期为大家带来实实在在的技术干货分享。
本月的技术干货Q&A分享我们将给大家带来在DS中使用正则表达式选择蛋白中的氨基酸的小技巧,可以极大的方便我们来有目的批量选择氨基酸。
菜单-Edit-Select ...打开菜单,如下图设置,选择正则表达式:T.R..
根据正则表达式的规则,点可以代表一个字符,比如字母或数字,因此,T.R..中前三个字符代表氨基酸名中第一个字母是T,第二个字母不定,第三个字母为R的氨基酸,这样就只有THR和TYR,R后面点的个数代表了数字的位数,如果是100号之前,则R之后只有两个数字,所以是两个点,点击Apply后可以看到,蛋白中序号为两位数的TYR和THR被选中了。依次类推,如果选择序号为个位数的,可以使用T.R.来匹配,当然前提是蛋白结构中10号之前得有相应氨基酸,否则是选不上的。部分正则匹配规则如下:
同样,如果寻找序列号在10-19之间的T.R类氨基酸可以使用T.R1.来匹配查找,具体其它正则表达式大家有兴趣可以自己探索一下。