|
> 1_NC_003279 protein_id:17510631; Caenorhabditis elegans chromosome I
TCGATAAGGGTTCTCTTTCAATTTAATCCCTGTGGCATTCACTACgtaagtttttgttttctctgaaattttcctaaaacctcactaatcacttccctatcgtttcgtcgattgcagGTTAACCGTTGCTCCTAATTAACGGAACCTCGCTGCATCGCTTCGATCGAGTACCCGGGAGAGgtaagcagaggggcactttaattatcggcctcagtcgggaataaccggtcaattcaaaatctgtttgctaacgtaaacaattcctccgtcctgccagGTCTTTGCCATCTCGCCCGTCCCTACGGTCAGCGTGCCGTGCTGAAGTACGCCCACTACACGCAGGCGTTCTTTTCGTGAAAACAGG
要求:1 打开文件in.txt,就是上面序列。
2 序列整理之后
> 1_NC_003279 protein_id:17510631; Caenorhabditis elegans chromosome I
E001TCGATAAGGGTTCTCTTTCAATTTAATCCCTGTGGCATTCACTACI001gtaagtttttgttttctctgaaattttcctaaaacctcactaatcacttccctatcgtttcgtcgattgcag
E002GTTAACCGTTGCTCCTAATTAACGGAACCTCGCTGCATCGCTTCGATCGAGTACCCGGGAGAGI002gtaagcagaggggcactttaattatcggcctcagtcgggaataaccggtcaattcaaaatctgtttgctaacgtaaacaattcctccgtcctgccag
E003GTCTTTGCCATCGTCCCGTCCCTACGGTCAGCGTGCCGTGCTGAAGTACGCCCACTACACGCAGGCGTTCTTTTCGTGAAAACAGG
3 把序列E001和序列E002合并,在他们中间向前后各取10bp,组成新序列E012,同理E023…….这只是一部分序列需要批量。输出文件out.txt
> 1_NC_003279 protein_id:17510631; Caenorhabditis elegans chromosome I
I001gtaagtttttgttttctctgaaattttcctaaaacctcactaatcacttccctatcgtttcgtcgattgcag
E012CATTCACTACGTTAACCGTTI002gtaagcagaggggcactttaattatcggcctcagtcgggaataaccggtcaattcaaaatctgtttgctaacgtaaacaattcctccgtcctgccag
E023CCCGGGAGAGGTCTTTGCCA4 需要批量处理的文件
|
-
-
4.zip
3.54 MB, 下载次数: 6
文件
|